结构域名词解释(你想要的都在这里)

踏入生命科学领域的你还在为找不到基因序列烦恼吗?还在为生物信息学文章发愁吗?NOW!小编整理了一些关于生物信息学、基因组学、蛋白质组学等各种组学相关研究学习所需要的数据库网站,希望能帮助到你的科研工作。内容较多,建议先收藏!核酸数据库★1.NCBINCBI是由美国国家生物技术信息中心(National Center for Biotechnology Information)开发并负责维护,隶属于美国国立卫生研究院(National Institutes of Health, NIH)。这是一个功能非常强大的生物数据库,可以做DNA、RNA甚至蛋白质的序列比对,查找相关序列的注释信息。网址:https://www.ncbi.nlm.nih.gov/★2.EMBL欧洲分子生物学实验室EMBL(The European Molecular Biology Laboratory),目前蛋白质信息最全的数据库,UniProt也是他家开发的。网址:https://www.ebi.ac.uk/ena/browser/home3.DDBJDDBJ(DNA Data Bank of Japan),建立于1984年,由日本国立遗传学研究所(National Institute of Geneics, NIG)开发并负责维护。DDBJ是世界三大DNA 数据库之一,与NCBI的GenBank,EMBL的EBI数据库共同组成国际DNA数据库 。该数据库最为常用的就是他家的KEGG通路数据库。网址:https://www.ddbj.nig.ac.jp/index-e.html4.CNGB中国国家数据库(China National GeneBank)位于深圳大鹏新区,是继世界三大数据库之后的全球第四大国家级数据库。它是中国首个,也是唯一一个国家基因库,相对于全球另外三个基因库而言,国家基因库样品保存的规模、存储量和可访问的数据量皆是全球最大。网址:https://db.cngb.org/5.BIGD中国国家基因组科学数据中心 生命与健康大数据中心 (National Genomics Data Center BIG Data Center),由北京基因组研究所管理。网址:https://bigd.big.ac.cn/蛋白质数据库一、蛋白质序列数据库1.swissprot一个人工注释的蛋白质序列数据库,注释可信度高,冗余度小。由欧洲生物信息学研究所EMBL-EBI与瑞士生物信息学研究所SIB共同管理。网址:http://us.expasy.org/sprot/2.TrEMBL(Translation from EMBL)一个计算机注释的蛋白质序列数据库,包含EMBL核酸序列数据库中的为蛋白质编码的核酸序列CDS的所有翻译产物,并把已经包含在swissprot中的序列剔除,但可信度低,冗余度大;也由由欧洲生物信息学研究所EMBL-EBI与瑞士生物信息学研究所SIB共同管理。★3.PIR蛋白质信息资源数据库(Protein Information Resourse),设在美国Georgrtown大学医学中心GUMC。一个支持基因组学、蛋白组学和系统生物学研究的综合公共生物信息学资源。网址:http://www.proteininformationresource.org/4.UniProtUniProt分三个层次的数据库:UniParc:收录所有UniProt数据库字库中的蛋白质序列,信息量大粗糙。UniRef:归纳UniProt几个主要数据库并将重复序列去除后的数据库。UniProtKB:由详细注释并与其他数据库由链接的数据库,可分为:UniProtKB/Swiss-Prot(人工注释)和UniProtKB/TrEMBL(计算机注释)。网址:https://www.uniprot.org/二、蛋白质结构数据库★1、PDB数据库PDB是目前最主要的收集生物蛋白质三维结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的三维结构数据库。其内容包括蛋白质的原子坐标、参考文献、一级和二级结构信息,也包括了晶体结构因数以及NMR实验数据等。PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的文件pdb。用三维视图软件打开pdb文件,可以查看蛋白质的立体结构。网址:https://www.rcsb.org/2、CTAH结构分类数据库CTAH包括PDB数据库中四种结构分类层次依次为:C:class,蛋白质种类T:topology/fold,蛋白质拓扑结构A:architecture,蛋白质二级结构的构架H:homologous superfamily 蛋白质同源超家族网址:http://cathdb.info/3、Scop2结构分类数据库特点是从蛋白质间的进化关系进行分类,也分四个层次。从顶部到底部分别为:class,类,二级结构——fold,折叠,空间几何关系——superfamily,超家族,远源蛋白的进化关系——family,家族,相近蛋白的进化关系。三、蛋白质功能域数据库Pfam数据库一个蛋白质结构域家族的集合,主要用于分析蛋白质序列的结构域和相关蛋白质家族的。代谢数据库一、代谢通路数据库★1、KEGGKEGG全称 Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书),由 Kanehisa实验室 在1995年开发。它拥有多个子数据库,包含基因组,生化反应,生化物质,疾病与药物,以及最常用PATHWAY通路信息。网址:https://www.kegg.jp/★2、GOGO(Gene Ontology)包含生物学领域知识体系本质的表示形式,本体通常由一组类(或术语或概念)组成,它们之间具有关系。网址:http://www.geneontology.org/3、NCBI BioSystems(前文已介绍)4、MetaNetXMetanetX,一个收录了大量代谢网络模型的注释数据库。通过MetanetX,用户可以浏览代谢网络或通路,利用多种分析工具进行分析,最终实现对代谢通路以及内部组分的分析。同时数据库也提供了数据接口,既可以下载,也可以上传提交自己的模型。网址:https://www.metanetx.org/二、代谢组学常用数据库1、MataboLightsMetaboLights 是代谢组实验和衍生信息的数据库。该数据库是跨物种、跨技术的,涵盖代谢物结构及其参考光谱及其生物学作用、位置和浓度,以及来自代谢实验的实验数据。网址:https://www.ebi.ac.uk/metabolights/2、HMDBHMDB于2007年首次发布,被认为是人类代谢研究的标准代谢组学资源,包含有关人类代谢物及其生物学作用、生理浓度、疾病相关性、化学反应、代谢途径和参考光谱的综合信息。网址:http://www.hmdb.ca/3、ECMDBECMDB 是一个专业的数据库,其中包含有关大肠杆菌(K12、MG1655 菌株)的大量代谢组学数据和代谢途径图。该数据库包括由 Wishart 实验室成员汇编的大量“原始”数据以及来自数百本教科书、科学期刊、代谢重建和其他电子数据库的其他材料。网址:http://ecmdb.ca/蛋白质分析一、蛋白特性分析ProtParam蛋白特性分析是指蛋白的一些物理和化学参数,如分子量、等电点、氨基酸和原子组成、消光系数、半衰期、不稳定系数、脂肪族氨基酸指数、亲水性。这些参数,有助于进行蛋白的相关生化实验。比如在体外体系(大肠杆菌、酵母等)表达和纯化目的蛋白时,需要考虑蛋白的分子量、等电点、消光系数、不稳定系数和亲水性等。在酶活实验中,也需要根据这些参数优化实验体系。网址:http://web.expasy.org/protparam/二、蛋白亲疏水性分析Protscale蛋白氨基酸的亲疏水性主要由其侧链基团R决定,如果R只是H或是C、H两元素组成的话,都是疏水的,如果含有极性侧链基团,如-OH、-SH、-COOH、-NH2 等,则就是极性的(亲水的)。疏水性氨基酸有酪氨酸、色氨酸、苯丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丙氨酸和蛋氨酸(甲硫氨酸)。疏水性氨基酸在蛋白质内部,在保持蛋白质的三级结构上,酶和基质、抗体和抗原间的相互作用等各种非共价键的分子结合方面,具有重要作用。网址:https://web.expasy.org/protscale/三、跨膜结构分析TMHMM蛋白的跨膜结构分析对于预测蛋白的亚细胞定位密切相关。如果具有跨膜结构,蛋白很可能定位于细胞中与膜相关的结构,如细胞质膜、叶绿体膜或线粒体膜等内膜系统。此外,蛋白跨膜结构分析对于蛋白功能分析也有一定的帮助。比如某蛋白没有跨膜结构,但是亚细胞定位实验显示其可定位于膜相关结构,这说明该蛋白可能通过其他膜定位蛋白招募过去的。网址:http://www.cbs.dtu.dk/services/TMHMM/四、信号肽分析SignalP峰信号位置为信号肽切割点,峰之前的序列为信号肽。信号肽是指引导新合成的蛋白质向分泌通路转移的短肽链,常位于蛋白的N-末端,负责把蛋白质引导到不同膜结构的亚细胞器内。编码分泌蛋白的mRNA在翻译时首先合成N末端的信号肽,它被信号肽识别蛋白(SRP)所识别,SRP将核糖体携带至内质网上,内质网膜上的 SPR 受体识别并与之结合。新合成蛋白在信号肽引导下到达内质网内腔,而信号肽则在信号肽酶的作用下被切除。由于它的引导,新生的多肽就能够通过内质网膜进入腔内,最终被分泌到胞外。在宿主菌中表达外源蛋白时,可用信号肽引导外源蛋白定位分泌到胞外,提高蛋白可溶性,在原核表达系统(大肠杆菌、芽孢杆菌等)和真核表达系统(如毕赤酵母)中均有应用。网址:http://www.cbs.dtu.dk/services/SignalP/五、磷酸化位点分析1、NetPhos网址:http://www.cbs.dtu.dk/services/NetPhos/2、KinasePhos-2.0网址:http://kinasephos2.mbc.nctu.edu.tw/蛋白质磷酸化指由蛋白质激酶催化的把 ATP 的磷酸基转移到底物蛋白质氨基酸残基(丝氨酸、苏氨酸、酪氨酸)上的过程,或者在信号作用下结合 GTP(通常以 GTP 取代 GDP),是生物体内一种普通的调节方式,在细胞信号转导的过程中起重要作用。在信号达到时通过获得一个或几个磷酸集团而被激活,而在信号减弱时能去除这些集团,从而失去活性。有时某个信号蛋白磷酸化通常造成下游的蛋白依次发生磷酸化,形成磷酸化级联反应。以上都是一些比较常见的、常用的数据库,带有“★”的是小编常用的数据库(可供参考)。其实,科研工作者并不需要完全掌握所有数据库的使用方法,只需根据自己的研究内容和需求,寻找相应的数据库网站进行了解和学习即可。好啦,今天的分享就到这里了,希望这边文章能够帮助到大家的科研工作!还想了解更多科研资讯,请关注【溢文生物】公众号

本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://www.175ku.com/27331.html