ncbi上传序列
‘壹’ 在NCBI上提交DNA序列前,标记DNA怎么做呢
1、登陆NCBI官网:网页链接
2、输入fasta文件或者是直接在搜索栏搜索该基因;
3、点击genbank,找到基因序列;
4、当前页点击ctrl+F,输入序列的具体信息就可以搜到你想要的序列。
但是您说的像是在提交前标记,这个恐怕是不行的,因为提前标记要么是截取一段固定的序列进行上传然后比对。提前标记在后面分析的时候也是显示不出来的,所以建议在找到序列后标记,或者就是已知固定序列比对,保存前后序列。
‘贰’ 如何利用BankIt向NCBI在线提交序列
许多期刊在文章发表之前需要在文章中有序列的登录号,并且要求你在文章发表时,序列可以被读者索取。 NCBI的GenBank提供了两个投递方式: 1、在线投递-BankIt,特点是比较方便。 2、本地投递文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其输出文件需要你通过电子邮件发给NCBI. 另外,上面所述一般适用于研究单个或多个功能基因的情况。如果大规模的测序如EST、 STS和GSS序列分别有专门的投递途径。 另外,提醒你的两个问题: 1、对你所投序列所属物种分类(拉丁名)要有所了解,这通常是出错的地方(seqin) 2、在你投递序列到发表文章之间,要注意NCBI发给你的电子邮件,它会询问你在什么时间将序列公布。 具体细节你可以浏览参考资料所指连接。
‘叁’ 如何向NCBI提交基因组序列
1.整理序列信息:包括病原采集地、病原的寄主、寄主症状、采集人等基本信息;还有序列分析结果,包括序列全长大小,开放阅读框(ORF)的长度、位置及特定ORF序列翻译的氨基酸序列等基因水平的信息,这对于接下来的快速准确提交序列及提交成功后为全世界其他作者准确全面分享此类信息很重要;
2.登陆BackIt站点,注意到页面右边的“Sign in to use BankIt”标签,点击登录进入。如果没有账号就注册一个(注意,此账号与NCBI账号不通用)。
附 注册账号步骤,需要填写的项目为:
Title:你的职位或头衔
First name:名
last name:姓
login:登陆名
Affiliation:所属机构地址,一般填写自己学校地址
E-mail Address:通信电邮,填完后会发随机密码到此电邮地址,使用随机密码进行登陆,当然登陆后可对密码进行重置;
3.登陆BankIt,看到如下图所示界面,此时NCBI会自动分配一个SubmissionID,但不是最终的提交序列ID:
接下来共有九个步骤(好事多磨):
3.1 Contact Information
填写个人姓名、机构、电邮等资料集联系方式,如果错误该页会有ERROR提示直到正确填写,填写完毕点击CONTINUE;
3.2 Reference
填写参考作者信息(Reference author)及序列相关信息,比如该序列是否对应有文章,如单纯提交序列则只需选择Unpublished即可(Reference title项可以填入“Direct Submission”),有的话就填写已发表文章的信息(卷、期等),接下来会问你该序列的提交者是否是序列的发现者等信息,填写完毕点击CONTINUE;
※提示:新版的BankIt中,接下来会有“Sequencing Technology”一项,呈现有454、Illumina、SOLiD及Other等测序方法选择,目前为“Sanger dideoxy sequencing”即一代测序方法测序,并且所提交的序列均为“assembled sequences”,目前的“assembly program”为“Lasergene,version 7.0”。
3.3 Nucleotide
包括三个小项:Submission Release Date(期望NCBI什么时候公布你的序列)、16S
rRNA submissions(该序列是否为16S rRNA)、Sequence(s) and Definition
Line(s)(会提示问你该序列是否为全长genomic
DNA、线状或环状等、序列长度,需要复制序列或提交FASTA格式文件),如若序列长度与复制序列或FASTA文件长度不同则会有提示,需要重新提交序列,依次选择即可。一般选择“Immediately after Processing”,“非16S rRNA”,“genomic DNA”,“circular”,“complete”等信息,然后将全序列粘贴到下方的空格中,别忘了在上方写上总核苷酸数。完后审查看有没有错误,继续CONTINUE;
3.4 Organism
填写Organism(病原物)的名字,即序列公开显示时候的标题(如MYVYNV分离物序列“Malvastrum yellow vein Yunnan virus isolate SC226-5, complete genome"),点击CONTINUE后会出现自动检索项目,核对后(有可能会进行选择)继续CONTINUE;
3.5 Submission Category
提交范畴,是否直接提交或通过第三方Annotation提交(不是太清楚什么意思,可能指的是从EMBL和DDBJ中导入的数据吧),一般为直接提交,如下图示选择Original,继续CONTINUE;
3.6 Source modifier
选择该病原物的种类,比如质粒、线粒体等;
Source
modifier下拉菜单及后面的Value设置:进一步选择该病原物获取信息,比如Country、Host、Clone、Collection
date、Strain/Isolate等,至少三项(Organelle/Location为细胞器/位置,该项可以不填写),否则该项不通过,尽量信息全面真实,需要继续添加则点击Add,填写完毕查看下方已填写表格进行信息核对,然后CONTINUE;
3.7 Primers
PCR引物项目,可选项目,不想填写可CONTINUE;
3.8 Features(※)
该步骤重要!将用到之前准备的内容,比如序列内ORFs等信息的填写,并根据之前的选项来填写该步骤,比如需要将DNA翻译为氨基酸序列并进行复制粘贴等,该步操作只需将之前准备信息录入即可,比较耗时;
点击下方“ADD”键,页面将切换为↓
在这里我们需要录入更多与该序列有关的信息,最主要的就是录入之前已经整理好的序列里面的开放阅读框(ORF)信息:Genetic Code设置为”Standard“,5'和3'都勾选上,Protein Name/Protein Description项都填写,将特定区域(ORF)的核苷酸序列翻译为氨基酸序列后(除去末端的终止子)复制到下方的”Amino Acid Sequence“框中,依次录入即可。在这里越详细越好,具体参照实际操作;
3.9 Review and Correct
对已填写信息进行复核及提交,并被告知在2个工作日之内会收到NCBI电邮,需要进一步对序列进行审查核对;
4.至此,基本序列提交已经完工,剩下的事情就是等待审核,大概两个工作日后会收到来自NCBI工作人员的电邮,如有问题会通知你进一步修改信息直到完全无误,包括以后的接受序列号,即你的序列会出现在NCBI里面世界上唯一的一个界面里。
‘肆’ ncbi提交序列问题
这封邮件是告诉你已经提交序列成功了,查找这个序列的ID (也就是 Genbank accession number
)是
BankIt1691102 BankIt1691102 KJ195333 (Genbank accession number一般是2位字母+6位数字,即KJ195333, 前面那一串不知道是什么东东)
你或者别人写文章的时候引用你提交的序列时需要注明这个Genbank accession number。
你可以在Genbank向公众释放这些序列前提交你的文章。
你上传的结果并不会自动录入Genbank。Genbank有专门的工作人员会检查你上传的序列以及做好注释。
由于你没有指定你提交的序列什么时候向公众发表,所以NCBI那边的人默认是他们把这些数据处理好就自动向公众发表(也就是大家都可以查得到),若果你不想这样,请发邮件给他们([email protected])。更多内容请见他们帖出来网址。
大概就是这样。
‘伍’ 如何向NCBI提交序列
1.整理序列信息:包括病原采集地、病原的寄主、寄主症状、采集人等基本信息;还有序列分析结果,包括序列全长大小,开放阅读框(ORF)的长度、位置及特定ORF序列翻译的氨基酸 序列等基因水平的信息,这对于接下来的快速准确提交序列及提交成功后为全世界其他作者准确全面分享此类信息很重要;
2.登陆BackIt站点,注意到页面右边的“Sign in to use BankIt”标签,点击登录进入。如果没有账号就注册一个(注意,此账号与ncbi 账号不通用)。
附 注册账号步骤,需要填写的项目为:
Title:你的职位或头衔
First name:名
last name:姓
login:登陆名
Affiliation:所属机构地址,一般填写自己学校地址
E-mail Address:通信电邮,填完后会发随机密码到此电邮地址,使用随机密码进行登陆,当然登陆后可对密码进行重置;
3.登陆BankIt,看到如下图所示界面,此时NCBI会自动分配一个SubmissionID,但不是最终的提交序列ID:
接下来共有九个步骤(好事多磨):
3.1 Contact Information
填写个人姓名、机构、电邮等资料集联系方式,如果错误该页会有ERROR提示直到正确填写,填写完毕点击CONTINUE;
3.2 Reference
填写参考作者信息(Reference author)及序列相关信息,比如该序列是否对应有文章,如单纯提交序列则只需选择Unpublished即可(Reference title项可以填入“Direct Submission”),有的话就填写已发表文章的信息(卷、期等),接下来会问你该序列的提交者是否是序列的发现者等信息,填写完毕点击CONTINUE;
※提示:新版的BankIt中,接下来会有“Sequencing Technology”一项,呈现有454、Illumina、SOLiD及Other等测序方法选择,目前为“Sanger dideoxy sequencing”即一代测序方法测序,并且所提交的序列均为“assembled sequences”,目前的“assembly program”为“Lasergene,version 7.0”。
‘陆’ 请问下这个NCBI序列怎么看
这封邮件是告诉你已经提交序列成功了,查找这个序列的id
(也就是
genbank
accession
number
)是
bankit1691102
bankit1691102
kj195333
(genbank
accession
number一般是2位字母+6位数字,即kj195333,
前面那一串不知道是什么东东)
你或者别人写文章的时候引用你提交的序列时需要注明这个genbank
accession
number。
你可以在genbank向公众释放这些序列前提交你的文章。
你上传的结果并不会自动录入genbank。genbank有专门的工作人员会检查你上传的序列以及做好注释。
由于你没有指定你提交的序列什么时候向公众发表,所以ncbi那边的人默认是他们把这些数据处理好就自动向公众发表(也就是大家都可以查得到),若果你不想这样,请发邮件给他们([email protected])。更多内容请见他们帖出来网址。
大概就是这样。
‘柒’ 有人在NCBI上上传过含有几个不同基因的序列吗
在NCBI主页上方search栏左边有一个database选择框,点击下拉三角形选择nucleotide(如图红框)在search栏输入基因名搜索即可。 以人的orc1基因为例, 在搜索结果中选择mRNA和complete cds序列的结果都可以,如下 点击进入序列文件查看详情,以...
首先打开NCBI网站首页,然后在search一栏中选择nucleotide,在框中输入你要的基因序列名称,点击search就行.然后会出来很多结果,因为很多基因是同名的,或是一个基因在不同种属中不一样,寻找你要的基因序列就行了.注意的是,要确定你的基因名称是否是统一的,我以前就是找一个基因费了很多事,之后发现是自己没有用通用的.找到基因序列,蛋白序列就很容易了,因为结果中会显示该基因的蛋白序列.你也可以在开始search的时候选protein,找到的就是蛋白序列了.多尝试就好了,其实很简单,英文不错的话,更简单.要有耐心.