有機小分子生物活性資料庫下載
A. 分子資料庫的概述
本條目介紹一下全球免費讓公眾使用的化合物及葯物分子資料庫 ,對化學及葯物研究特別有用。
(注意: 以下信息來自於美國MedKoo Biosciences, Inc。)
1.美國國家醫學圖書館化學身份證(CHEMIDPLUS)資料庫
該網頁可檢索葯物化學結構,本網站可以用葯物名稱查找其化學結構. 此外,本資料庫還可以查看毒性, 理化性質, 葯品代碼等。
2. 美國國家醫學圖書館PUBCHEM資料庫可檢索葯物化學結構
本資料庫是美 國國家健康研究所(NIH)和美國國家醫學圖書館(NLM)的大型葯物分子庫。NIH 是美國醫學研究機構,下設27個機構和中心,也是美國健康與人類服務部的一個組成部分。它是一個重要的聯邦機構,執行和支持基礎、臨床及可轉化醫學研究, 調查普通及罕見疾病的原因、治療及治癒情況。PubChem資料庫是美國國家衛生署分子庫路線圖計劃的一個組成部分,是由NIH國家生物技術信心中心開發 的一個化學結構及分子生物活性綜合資料庫.
3。 美國國家癌症研究所(NCI)抗癌葯葯物詞典
該數據收集了4000多條與癌症醫學相關的術語和化合物性質。
4. 葯物合成資料庫(Drug SynthesisDatabase)
該數據是這個葯物在線網推出的數據 庫.本資料庫提供近7000種已上市或在研葯物的葯物合成相關的信息,如葯品名、結構式、化學名、CAS登記號、分子式、分子量、化學活性、開發階段、研 究機構等。最大的優點是快速檢索合成路線,並給出參考文獻來源。
檢索條件支持模糊查詢,各輸入條件間的檢索關系為邏輯與(即AND關系)。檢索條件選擇其一即可查詢。檢索方法包括:
*葯物名稱:(註:包含通用名、商標名、研發代號、異名等)。如Loratadine、Cefpirome.
*化學名稱:(註:包含CA命名、普通命名等)。
*CAS登記號:(註:美國化學文摘登記號)。
5. 有機合成方法資料庫
Since 1921, OrganicSyntheses has provided the chemistry community with annual collections ofdetailed, reliable, and carefully checked proceres for the synthesis oforganic compounds. Some proceres describe practical methods for thepreparation of specific compounds of interest, while other proceresillustrate important synthetic methods with general utility. Each procere iswritten in considerably more detail as compared to typical experimentalproceres in other journals, and each reaction and all characterization datahas been carefully checked for reprocibility in the laboratory ofa member of the Board of Editors.
Organic Synthesesproceres may be accessed either via the tables of contents of indivialvolumes (journal mode) or by concting structure and keywordsearches (database mode). Specific in divial proceres can beaccessed via the table of contents for either the original annual volume orcollective volume in which the procere appeared. Database modeallows users to simultaneously search all volumes of Organic Syntheses bykeywords or by inputting structures and substructures. Structure searchingrequires the ChemDraw plugin which can be downloaded according to theinstructions found in the left margin. Articles from future volumes of OrganicSyntheses that are not yet incorporated in the searchable database can beaccessed on the Org Syn Express page.
6. 有機合成人名反應
該資料庫是葯物在線網推出的數據 庫.TheOrganic Name Reactions (ONR) section is intended to serve the professionalchemist and student by describing organic chemical reactions which have come tobe recognized and referred to by name within the chemistry community. A selectgroup has been chosen for addition to this section. Each reaction descriptionis designed to be informative and representative of the pertinent literature;however, it is not meant to be comprehensive. The descriptions are composed ofthe following: (1) name(s) associated with the reaction, (2) the originaland/or primary contributor(s) connected with the discovery and/or developmentof the reaction, (3) a concise description of the transformation, (4) areaction scheme, (5) key references, and (6) cross references to other ONRbased on commonalities. The index included in this section also listssupplementary terms.
7. 有機合成反應庫
該數據可是這個葯物在線網推出的資料庫.含有400多個有機合成人名反應。
8. 化學物質索引資料庫(Chemical IndexDatabase)
該資料庫是葯物在線網推出的資料庫。 本資料庫為化學物質特性資料庫,包含大量具葯理活性及生物活性的物質性質信息數據。檢索條件支持模糊查詢,各輸入條件間的檢索關系為邏輯與(即AND關 系)。化學結構式為矢量格式圖片,可利用系統自帶圖片預覽工具或支持該格式的工具進行無損縮放查看。檢索結果包括:(a) 索引信息:如物質名稱、化學結構式圖、化學文摘登記號(CAS)、CA名稱、商標名、化學結構式、分子式、分子量、元素組成等。(b) 參考文獻:提供公開物質理化性質、制備方法、分析方法、葯理葯效、臨床研究等的重要期刊、專利、綜述等極具參考價值的文獻。(c) 物質特性:包括理化特性數據,如熔點、沸點、閃點、溶解性、多晶物質狀態、光譜吸收特徵數據、葯物治療分類等.
其檢索的方法有:
*物質名稱(英文名):(包含化學名、通用名、商標名、異名等的全名或部分(大於3個字元),如Ceftriaxone,Adefovir.)
*CA登記號(CAS Registry Number):
*注:美國化學文摘登記號
*參考文獻(Literature References)
*葯理活性(Keywords)
*用途(Usages)
*治療分類(Therapeutic Category)
*分子式(Molecular Formula)
*分子量(Molecular Weight)
*熔點(Melting Point)
*注:熔點值,以攝氏度為單位
*沸點(Boiling Point)
*注:沸點值,以攝氏度為單位
*解離常數(pKa)
*比旋度(Optical Rotation)
*油水分配系數(LogP)
*最大吸收值(Absorption Maximum)
*密度(Density)
*折光率(Index of Refraction)
*毒性數據(Toxicity)
B. 蛋白質序列資料庫包含哪些內容
蛋白質資料庫
1. PIR和PSDPIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,包含超過142,000條蛋白質序列(至99年9月),其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
PIR和PSD的網址是:http://pir.georgetown.e/。
資料庫下載地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。
SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
SWISS-PROT的網址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
PROSITE的網址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
RCSB的PDB資料庫網址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
SCOP的網址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。
COG庫的網址是:http://www.ncbi.nlm.nih.gov/COG。
下載COG庫和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。