蛋白质结构数据库

发布时间: 2022-07-19 16:19:59

⑴ 蛋白质序列数据库的介绍

指应用计算机功能分析生物学信息的数据库。应用计算机的运算法则，比较DNA和蛋白质序列而检测结构、功能和序列之间的进化关系。各种基因组的序列产生大量的DNA序列数据和生物信息，已经被应用于研究基因的功能，预测以前未知的基因功能。现在人们的注意力主要集中在从仅有的氨基酸序列预测蛋白质结构和功能。

⑵ 我们生物化学讲到蛋白质的内容，想问一下一个名词，什么叫“蛋白质三级结构的数据库”

蛋白质结构可以进行预测。通过已知氨基酸序列，利用计算的手段预测蛋白质的二级结构和空间三维结构。
目前蛋白质结构数据库 PDB中所存储的蛋白质三维结构主要通过X 射线晶体衍射和核磁共振成像技术，蛋白质的结构检测比序列检测要难得多。

⑶ 国际着名的三大蛋白质数据库

国际着名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。

1、UniProt数据库

蛋白组学常用数据库UniProt（全称UniProt Protein Resource），建立于1986年，由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的，其信息量丰富、资源广泛，是目前公认的首选免费蛋白质数据库。

2、The Human Protein Atlas数据库

The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息，并提供免费查询。

瑞典Knut&Alice Wallenberg基金会利用免疫组化技术，检查每一种蛋白质在人类48种正常组织，20种肿瘤组织，47个细胞系和12种血液细胞内的分布和表达，其结果用至少576张免疫组化染色图表示，并经专业人员校对和标引，保证染色结果具有充分的代表性。

3、PhosphoSitePlus数据库

PhosphoSitePlus数据库是一个由CST和NIH联合开发的免费资源数据库，总结归纳了海量通过科学研究发现的蛋白修饰位点，包括磷酸化、甲基化、乙酰化、泛素化等，并且包括一些CST公司发现但未发表的蛋白修饰位点。

该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究PTMs在正常和病理细胞/组织中的作用，同时它也是发现新的疾病标志物和药物靶点的有力工具。

性能及历史

蛋白质数据库（HPDB），建于2005年5月，动态展示生物大分子立体结构，鼠标点击放大分子结构、原子定位、测定原子之间距离，可用于教学或科研。服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。

分子结构特征描述采用汉语，同时提供英文原文以供考证。对于善于使用英文的读者，我们提倡直接访问RCSB PDB，一来可以减少网络拥挤，二来可以减少由于HPDB的翻译不妥带来的不便。

蛋白质数据库（HPDB）对每个蛋白质分子结构说明部分做了中文翻译（最新加入数据库的分子除外），内容包括分子结构定性描述、样品的来源、表达载体、宿主、化学分析方法、分子结构组成成分等。这些信息并同蛋白质分子结构数据存储于数据库，因此HPDB支持中文查询。

蛋白质数据库（HPDB）虽然翻译了“分子结构说明”部分，但为了保证数据的可靠性和准确性，HPDB对一级结构序列及大分子结构坐标数据等未做任何改动，数据库保持RCSB PDB核实后的原始实验数据文件，并保持PDB文件格式和蛋白质分子编号。

⑷ 蛋白质三维结构数据库的功能

PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)2.5维（以二维的形式表示三维的数据）结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计，PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质，包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。
PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索，可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库，包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。

⑸ 常用的查询蛋白质结构以及序列的数据库主要有哪些

1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库，可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引，以及数据库内部条目之间的索引，这些内部索引帮助用户在包括复合物、酶－底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库，每周可以得到更新部分。
PSD数据库有几个辅助数据库，如基于超家族的非冗余库等。PIR提供三类序列搜索服务：基于文本的交互式检索；标准的序列相似性搜索，包括BLAST、FASTA等；结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库，由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成，每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等，注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列，并与其它30多个数据建立了交叉引用，其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列，序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式，并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下，某个蛋白质与已知功能蛋白质的整体序列相似性很低，但由于功能的需要保留了与功能密切相关的序列模式，这样就可能通过PROSITE的搜索找到隐含的功能motif，因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等；除了序列模式之外，PROSITE还包括由多序列比对构建的profile，能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库，由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据，经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务，以及关于PDB数据文件格式和其它文档的说明，PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次：家族，描述相近的进化关系；超家族，描述远源的进化关系；折叠子(fold)，描述空间几何结构的关系；折叠类，所有折叠子被归于全α、全β、α/β、α＋β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库，这个库通常被用来评估各种序列比对算法。此外，SCOP还提供一个PDB-ISL中介序列库，通过与这个库中序列的两两比对，可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白，根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序，可以把某个蛋白质与所有COGs中的蛋白质进行比对，并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询，基于Web的COGNITOR服务，系统进化模式的查询服务等。

⑹ 总结蛋白质序列数据库演变的过程

蛋白质序列数据库指应用计算机功能分析生物学信息的数据库。应用计算机的运算法则，比较DNA和蛋白质序列而检测结构、功能和序列之间的进化关系。

各种基因组的序列产生大量的DNA序列数据和生物信息，已经被应用于研究基因的功能，预测以前未知的基因功能。现在人们的注意力主要集中在从仅有的氨基酸序列预测蛋白质结构和功能。

历史追溯：

由于蛋白质序列测定技术先于DNA序列测定技术问世，蛋白质序列的搜集也早于DNA序列。蛋白质序列数据库的雏形可以追溯到60年代。60年代中期到80年代初，美国国家生物医学研究基金会(National Biomedical Research Foundation，简称NBRF)。

Dayhoff领导的研究组将搜集到的蛋白质序列和结构信息以“蛋白质序列和结构地图集”(Atlas of Protein Sequence and Structure)的形式发表，主要用来研究蛋白质的进化关系。1984年，“蛋白质信息资源”(Protein Information Resource，简称PIR)计划正式启动。

蛋白质序列数据库PIR也因此而诞生。与核酸序列数据库的国际合作相呼应，1988年，美国的NBRF、日本的国际蛋白质信息数据库(Japanese International Protein Information Database，简称JIPID)。

德国的慕尼黑蛋白质序列信息中心(Munich Information Center for Protein Sequences，简称MIPS)合作成立了国际蛋白质信息中心(PIR-International)，共同收集和维护蛋白质序列数据库PIR，[Barker等, 2000]。

⑺ 蛋白质三维结构数据库的数据格式

每个PDB文件可能分割成一系列行，由行终止符终止。在记录文件中每行由80列组成。每条PDB记录末尾标志应该是行终止符。PDB文件中每行都是自我识别的。每行的前六列存放记录名称，左对齐空格补足.必须和规定的记录名称一致。PDB文件也可看成是各种记录类型的总和。每个记录类型包括一行或多行又被更深一层分成各字段。以下是PDB文件存储数据格式的一个完整简洁的说明：
标题部分
1 HEADER(分子类，公布日期、ID号)
2 OBSLTE (注明此ID号已改为新号)
3 TITLE(说明实验方法类型)
4 CAVEAT(可能的错误提示)
5 COMPND(化合物分子组成)
6 SOURCE(化合物来源)
7 KEYWDS(关键词)
8 EXPDTA(测定结构所用的实验方法)
9 AUTHOR(结构测定者)
10 REVDAT(修订日期及相关内容)
11 SPRSDE(已撤销或更改的相关记录)
12 JRNL(发表坐标集的文献)
13 REMARK
REMARK 1(有关文献)
REMARK 2(最大分辨率)
REMARK 3(用到的程序和统计方法)
REMARK 4-999
一级结构
1 DBREF (其他序列库的有关记录)
2 SEQADV ( PDB与其他记录的出入)
3 SEQRES (残基序列)
4 MODRES (对标准残基的修饰)
杂因子
1 HET(非标准残基)
2 HETNAM(非标准残基的名称)
3 HETSNY (非标准残基的同义字)
4 FORMOL（非标准残基的化学式）
二级结构
1 HELIX(螺旋)
2 SHEET(折叠片)
3 TURN(转角)
连接注释
1 SSBOND(二硫键)
2 LINK(残基间化学键)
3 HYDBND(氢键)
4 SLTBRG(盐桥)
5 CISPEP(顺式残基)
晶胞特征及坐标变换
1 CRYST1(晶胞参数)
2 ORIGXn(直角－PDB坐标)
3 SCALEn(直角－部分结晶学坐标)
4 MTRIXn(非晶相对称)
5 TVECT(转换因子)
坐标部分
1 MODEL(多亚基时示亚基号)
2 ATOM(标准基团的原子坐标)
3 SIGATM(标准差)
4 ANISOU(温度因子)
5 SIGUIJ(各种温度因素导致的标准差)
6 TER(链末端)
7 HETATM(非标准基团原子坐标)
8 ENDMDL(亚基结束)
连通性部分
CONECT(原子间的连通性有关记录)
簿记
1 MASTER (版权拥有者)
2 END(文件结束)

⑻ 构建蛋白质二级数据库的基本原则是什么

生物大分子三维空间结构数据库是一类重要的生物信息学数据库。蛋白质结构数据库(ProreinData Bank，PDB)是1971年创建的国际上最着名、最完整的蛋白质三维结构数据库。另外还有蛋白质分类数据库SCOP和CATH。

⑼ 蛋白质三维结构数据库的介绍

蛋白质结构数据库(Protein Data Bank,简称PDB)是美国纽约Brookhaven国家实验室于1971年创建的。为适应结构基因组和生物信息学研究的需要，1998年10月由美国国家科学基金委员会、能源部和卫生研究院资助，成立了结构生物学合作研究协会(Research Collaboratory for Structural Bioinformat-ics,简称RCSB)。PDB数据库改由RCSB管理，目前主要成员为拉特格斯大学(Rutgers University)、圣地亚哥超级计算中心(San Diego Supercomputer Cen-ter,简称SDSC)和国家标准化研究所(National Insti-tutes of Standards andTechnology,简称NIST)。和核酸序列数据库一样，可以通过网络直接向PDB数据库提交数据。

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：644

制作脚本网站发布：2025-10-20 08:17:34 浏览：935

python中的init方法发布：2025-10-20 08:17:33 浏览：631

图案密码什么意思发布：2025-10-20 08:16:56 浏览：820

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：730

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1065

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：298

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：159

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：849

python股票数据获取发布：2025-10-20 07:39:44 浏览：762

蛋白质结构数据库

与蛋白质结构数据库相关的资讯