ncbi上传数据
A. 转录组测序所得的数据,怎样传到NCBI的SRA数据库
xshell连接NCBI服务器 输入命令 ftp
连接成功后输入账号 密码
mkdir命令创建一个文件夹,以你的BioProject accession命名
FTP 连接成功后连接成功后
进入刚才建立的BioProject文件夹
把原始数据拖进去即可
传输过程中,如果一定时间(五分钟?)没有激活传输界面,可能会导致连接断开
进度可能会一直停在99%,重新连接成功后,也一直卡在99%,不过似乎数据还是上传成功了的
传输成功的会显示linked,同时FTP里对应的文件会消失 传输成功的会显示linked,同时FTP里对应的文件会消失
全部文件夹都传输成功了会变成queued
然后就等NCBI处理了
B. 上传数据到NCBI
请咨询你的导师或者到生物谷那种专业地方问…网络只是个不入流的不专业搜索器…
C. ncbi上传数据时出现session stop
很可能是防火墙的问题
如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。
D. 如何将测序数据上传到NCBI的SRA数据库
一般上传数据到NCBI SRA的过程需要6步:
1、Create a BioProject for this research
2、Create a BioSample submission for your biological sample(s)
3、Gather Sequence Data Files
4、Enter Metadata on SRA website
a、Create SRA submission
b、Create Experiment(s) and link to BioProject and BioSample
c、Create Run(s)
5、Transfer Data files to SRA
6、Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,尤其是各处的Alias。但是,可以联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。
E. NCBI上传数据时出现error+50
可能是网络的不稳定导致数据传输错误。
网络并不稳定时,先不要上传数据,先将电脑关机再打开,或者重启,连接比较好的网络连接,再进行传输数据即可。
NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献,而且往往成为应用研究活动产生新方法的源泉。
F. 如何将rna-seq的数据提交到ncbi中geo
其实很简单,
1.首先建立一个meta file,即包含实验信息的文件
2.将测序的fastq(*.fq或*.fastq)文件准备好,此为原始数据(必须)。
3.将每个fastq文件处理后(去接头,合并相同序列)的序列整理为SEQ
COUNT两列的文件即可,此为处理后数据(应该也是必须)
4.将这些文件压缩为文件包(zip或RAR),命名为:账户名(你的GEO账户名).rar
5.上传至ftp://geo:[email protected]/fasp,因为文件较大,推荐使用flashXP;除非网络好,超快。
6.写一份邮件给GEO的网管:[email protected],说明你的数据已经上传,让其尽快发布,
我写的例子:
Dear
Sir,
We would like to submit our Illumina Genome Analyzer results to your GEO
web site.
We have upload our data file zmyang_files.rar to ftp://geo:[email protected]/fasp under the
GEO account user name xxx.
xxx.rar includes:
Illumina meta file:
GEO_Illumina_metadata.xls
processed data
files:
x.txt
y.txt
z.txt
raw data files in fastq
format:
x.fq
y.fq
z.fq
We want to release our data ASAP.
Thanks.
该流程我已重复n次,亲自手写流程,保证可靠。
实际该流程在GEO网站是有个大概的,但是所言含糊,需分析逻辑而后得其详。 转载
G. 如何向NCBI上传数据
许多期刊在文章发表之前需要在文章中有序列的登录号,并且要求你在文章发表时,序列可以被读者索取。
NCBI的GenBank提供了两个投递方式:
1、在线投递-BankIt,特点是比较方便。
2、本地投递文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其输出文件需要你通过电子邮件发给NCBI.
另外,上面所述一般适用于研究单个或多个功能基因的情况。如果大规模的测序如EST、 STS和GSS序列分别有专门的投递途径。
另外,提醒你的两个问题:
1、对你所投序列所属物种分类(拉丁名)要有所了解,这通常是出错的地方(seqin)
2、在你投递序列到发表文章之间,要注意NCBI发给你的电子邮件,它会询问你在什么时间将序列公布。
具体细节你可以浏览参考资料所指连接。
H. ncbi上传时gb文件怎么来的
NCBI中查找序列号时导出来之后是.gb文件。
GenBank的文件。包含一个gene的名称,编号,发现者,参考文献,外显子位置,编码区序列,蛋白序列等等信息。
.gb文件用记事本就可以打开。
拓展:
NCBI位于马里兰州的贝塞斯达, 建立于1988年· NCBI保管GenBank的基因测序数据和Medline的生物医学研究论文索引· 所有的这些数据库都可以通过Entrez搜索引擎在线访问。
国家生物技术信息中心(National Center for Biotechnology Information, 简称NCBI) 是美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所的一部分).