有机小分子生物活性数据库下载
A. 分子数据库的概述
本条目介绍一下全球免费让公众使用的化合物及药物分子数据库 ,对化学及药物研究特别有用。
(注意: 以下信息来自于美国MedKoo Biosciences, Inc。)
1.美国国家医学图书馆化学身份证(CHEMIDPLUS)数据库
该网页可检索药物化学结构,本网站可以用药物名称查找其化学结构. 此外,本数据库还可以查看毒性, 理化性质, 药品代码等。
2. 美国国家医学图书馆PUBCHEM数据库可检索药物化学结构
本数据库是美 国国家健康研究所(NIH)和美国国家医学图书馆(NLM)的大型药物分子库。NIH 是美国医学研究机构,下设27个机构和中心,也是美国健康与人类服务部的一个组成部分。它是一个重要的联邦机构,执行和支持基础、临床及可转化医学研究, 调查普通及罕见疾病的原因、治疗及治愈情况。PubChem数据库是美国国家卫生署分子库路线图计划的一个组成部分,是由NIH国家生物技术信心中心开发 的一个化学结构及分子生物活性综合数据库.
3。 美国国家癌症研究所(NCI)抗癌药药物词典
该数据收集了4000多条与癌症医学相关的术语和化合物性质。
4. 药物合成数据库(Drug SynthesisDatabase)
该数据是这个药物在线网推出的数据 库.本数据库提供近7000种已上市或在研药物的药物合成相关的信息,如药品名、结构式、化学名、CAS登记号、分子式、分子量、化学活性、开发阶段、研 究机构等。最大的优点是快速检索合成路线,并给出参考文献来源。
检索条件支持模糊查询,各输入条件间的检索关系为逻辑与(即AND关系)。检索条件选择其一即可查询。检索方法包括:
*药物名称:(注:包含通用名、商标名、研发代号、异名等)。如Loratadine、Cefpirome.
*化学名称:(注:包含CA命名、普通命名等)。
*CAS登记号:(注:美国化学文摘登记号)。
5. 有机合成方法数据库
Since 1921, OrganicSyntheses has provided the chemistry community with annual collections ofdetailed, reliable, and carefully checked proceres for the synthesis oforganic compounds. Some proceres describe practical methods for thepreparation of specific compounds of interest, while other proceresillustrate important synthetic methods with general utility. Each procere iswritten in considerably more detail as compared to typical experimentalproceres in other journals, and each reaction and all characterization datahas been carefully checked for reprocibility in the laboratory ofa member of the Board of Editors.
Organic Synthesesproceres may be accessed either via the tables of contents of indivialvolumes (journal mode) or by concting structure and keywordsearches (database mode). Specific in divial proceres can beaccessed via the table of contents for either the original annual volume orcollective volume in which the procere appeared. Database modeallows users to simultaneously search all volumes of Organic Syntheses bykeywords or by inputting structures and substructures. Structure searchingrequires the ChemDraw plugin which can be downloaded according to theinstructions found in the left margin. Articles from future volumes of OrganicSyntheses that are not yet incorporated in the searchable database can beaccessed on the Org Syn Express page.
6. 有机合成人名反应
该数据库是药物在线网推出的数据 库.TheOrganic Name Reactions (ONR) section is intended to serve the professionalchemist and student by describing organic chemical reactions which have come tobe recognized and referred to by name within the chemistry community. A selectgroup has been chosen for addition to this section. Each reaction descriptionis designed to be informative and representative of the pertinent literature;however, it is not meant to be comprehensive. The descriptions are composed ofthe following: (1) name(s) associated with the reaction, (2) the originaland/or primary contributor(s) connected with the discovery and/or developmentof the reaction, (3) a concise description of the transformation, (4) areaction scheme, (5) key references, and (6) cross references to other ONRbased on commonalities. The index included in this section also listssupplementary terms.
7. 有机合成反应库
该数据可是这个药物在线网推出的数据库.含有400多个有机合成人名反应。
8. 化学物质索引数据库(Chemical IndexDatabase)
该数据库是药物在线网推出的数据库。 本数据库为化学物质特性数据库,包含大量具药理活性及生物活性的物质性质信息数据。检索条件支持模糊查询,各输入条件间的检索关系为逻辑与(即AND关 系)。化学结构式为矢量格式图片,可利用系统自带图片预览工具或支持该格式的工具进行无损缩放查看。检索结果包括:(a) 索引信息:如物质名称、化学结构式图、化学文摘登记号(CAS)、CA名称、商标名、化学结构式、分子式、分子量、元素组成等。(b) 参考文献:提供公开物质理化性质、制备方法、分析方法、药理药效、临床研究等的重要期刊、专利、综述等极具参考价值的文献。(c) 物质特性:包括理化特性数据,如熔点、沸点、闪点、溶解性、多晶物质状态、光谱吸收特征数据、药物治疗分类等.
其检索的方法有:
*物质名称(英文名):(包含化学名、通用名、商标名、异名等的全名或部分(大于3个字符),如Ceftriaxone,Adefovir.)
*CA登记号(CAS Registry Number):
*注:美国化学文摘登记号
*参考文献(Literature References)
*药理活性(Keywords)
*用途(Usages)
*治疗分类(Therapeutic Category)
*分子式(Molecular Formula)
*分子量(Molecular Weight)
*熔点(Melting Point)
*注:熔点值,以摄氏度为单位
*沸点(Boiling Point)
*注:沸点值,以摄氏度为单位
*解离常数(pKa)
*比旋度(Optical Rotation)
*油水分配系数(LogP)
*最大吸收值(Absorption Maximum)
*密度(Density)
*折光率(Index of Refraction)
*毒性数据(Toxicity)
B. 蛋白质序列数据库包含哪些内容
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。