scop数据库
① 试述SCOP蛋白质分类方案
SCOP将PDB数据库中的蛋白质按传统分类方法分成α型、β型、α/β型、α+β型,并将多结构域蛋白、膜蛋白和细胞表面蛋白、N蛋白单独分类,一共分成7种类型,并在此基础上,按折叠类型、超家族、家族三个层次逐级分类。对于具有不同种属来源的同源蛋白家族,SCOP数据库按照种属名称将它们分成若干子类,一直到蛋白质分子的亚基
② 构建蛋白质二级数据库的基本原则是什么
生物大分子三维空间结构数据库是一类重要的生物信息学数据库。蛋白质结构数据库(ProreinData Bank,PDB)是1971年创建的国际上最着名、最完整的蛋白质三维结构数据库。另外还有蛋白质分类数据库SCOP和CATH。
③ 如何将数据库接入oscilloscop
用函数,在总表中写公式等于分表中的数据,在“工具-选项”中设置“自动重算”就行了
④ 简述蛋白质的等级结构以及维持各级结构的主要作用力
蛋白质的结构可划分为4个层次,即一级结构、二级结构、三级结构、四级结构.
其中,一级结构即基本结构,
二级、三级、四级属于空间结构.
维持的力:
一级:主要是肽键,还有二硫键;
二级:是氢键 ;
三级:是次级键,包括:二硫键、氢键、盐键、范德华力、疏水作用(主要);
四级:是非共价键,包括:氢键、盐键、范德华力、疏水作用.
(4)scop数据库扩展阅读:
蛋白质结构是指蛋白质分子的空间结构。蛋白质主要由碳、氢、氧、氮等化学元素组成,是一类重要的生物大分子,所有蛋白质都是由20种不同氨基酸连接形成的多聚体,在形成蛋白质后,这些氨基酸又被称为残基。
作用
1.构成生物体内基本物质,为生长及维持生命所必需;
2.部分蛋白质可作为生物催化剂,即酶和激素;
3.生物的免疫作用所必需的物资;
4.有些蛋白质会导致食物过敏。
化学组成
(1)单纯蛋白质:仅含有AAs
(2)结合蛋白质:由AAs和其他非蛋白质化合物所组成
(3)衍生蛋白质:用化学或酶学方法得到的化合物
分子组成
基本单位:氨基酸 有不同的AAs通过肽键相互连接而成
蛋白质→眎→胨→多肽→二肽→多肽→氨基酸
元素组成:由碳,氢,氧,氮,硫,磷,碘,铁,锌等元素组成。
功能分类
(1)结构蛋白质:角蛋白,胶原蛋白,弹性蛋白
(2)有生物活性的蛋白质:酶,激素,免疫球蛋白
(3)食品蛋白质:凡可供食用,易消化,无毒和可供人类利用的蛋白质
对蛋白质结构进行分类的方法有多种,有多个结构数据库(包括SCOP、CATH和FSSP)分别采用不同的方法进行结构分类。存放蛋白质结构的PDB数据库中就引用了SCOP的分类。对于大多数已分类的蛋白质结构来说,SCOP、CATH和FSSP的分类是相同的,但在一些结构中还有所区别。
⑤ 蛋白质序列数据库包含哪些内容
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。
⑥ 蛋白质结构和功能多样性的直接和根本原因是什么
一、直接原因:
1、氨基酸种类不同;
2、数目成百上千;
3、排列顺序千变万化;
4、肽链的空间结构千差万别。
二、根本原因
根本原因是由于基因的多样性和基因选择性表达。
组成蛋白质的氨基酸约20种。人体内有8种氨基酸是人体细胞不能合成、必须从环境中直接获取的,叫必需氨基酸,另外12种是人体细胞能够合成的氨基酸叫非必需氨基酸。
(6)scop数据库扩展阅读
一、蛋白质的功能
(1)结构物质,如肌肉、羽毛、蛛丝;
(2)催化作用,如绝大多数酶;
(3)运输作用,如血红蛋白、载体蛋白;
(4)调节作用,如胰岛素降血糖;
(5)免疫作用,如抗体。
二、结构特点
每种氨基酸至少都含有一个氨基(-NH2)和一个羧基(-COOH),并都有一个氨基和一个羧基连在同一个碳原子上,此外还连接一个氢原子和一个R基团,所以各种氨基酸之间的区别在于R基的不同。如甘氨酸的R基是(-H),丙氨酸的R基是(-CH3)。
参考资料来源:搜狗网络-蛋白质结构
参考资料来源:搜狗网络-蛋白质
⑦ 蛋白质三维结构数据库的功能
PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)2.5维(以二维的形式表示三维的数据)结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。
PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。
⑧ Oracle里,scope=both或者scop=pfile这个选项是做什么用的谢谢你。
应该是scope=both和scope=spfile
Oracle 里面有个叫做spfile的东西,就是动态参数文件,里面设置了Oracle 的各种参数。所谓的动态,就是说你可以在不关闭数据库的情况下,更改数据库参数,记录在spfile里面。更改参数的时候,有4种scope选项。scope就是范围
++ scope=spfile 仅仅更改spfile里面的记载,不更改内存,也就是不立即生效,而是等下次数据库启动生效。有一些参数只允许用这种方法更改
++ scope=memory 仅仅更改内存,不改spfile。也就是下次启动就失效了
++ scope=both 内存和spfile都更改
++ 不指定scope参数,等同于scope=both.