ncbi上傳數據
A. 轉錄組測序所得的數據,怎樣傳到NCBI的SRA資料庫
xshell連接NCBI伺服器 輸入命令 ftp
連接成功後輸入賬號 密碼
mkdir命令創建一個文件夾,以你的BioProject accession命名
FTP 連接成功後連接成功後
進入剛才建立的BioProject文件夾
把原始數據拖進去即可
傳輸過程中,如果一定時間(五分鍾?)沒有激活傳輸界面,可能會導致連接斷開
進度可能會一直停在99%,重新連接成功後,也一直卡在99%,不過似乎數據還是上傳成功了的
傳輸成功的會顯示linked,同時FTP里對應的文件會消失 傳輸成功的會顯示linked,同時FTP里對應的文件會消失
全部文件夾都傳輸成功了會變成queued
然後就等NCBI處理了
B. 上傳數據到NCBI
請咨詢你的導師或者到生物谷那種專業地方問…網路只是個不入流的不專業搜索器…
C. ncbi上傳數據時出現session stop
很可能是防火牆的問題
如果網路防火牆設置不當,如安全等級過高、不小心把IE放進了阻止訪問列表、錯誤的防火牆策略等,可嘗試檢查策略、降低防火牆安全等級或直接關掉試試是否恢復正常。
D. 如何將測序數據上傳到NCBI的SRA資料庫
一般上傳數據到NCBI SRA的過程需要6步:
1、Create a BioProject for this research
2、Create a BioSample submission for your biological sample(s)
3、Gather Sequence Data Files
4、Enter Metadata on SRA website
a、Create SRA submission
b、Create Experiment(s) and link to BioProject and BioSample
c、Create Run(s)
5、Transfer Data files to SRA
6、Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一點是,上傳的過程中很多地方一旦保存或提交就不可以修改,尤其是各處的Alias。但是,可以聯系NCBI的工作人員修改內容。NCBI的工作效率是很高的,一般不超過48小時,就可以得到確認,並拿到登錄號。
E. NCBI上傳數據時出現error+50
可能是網路的不穩定導致數據傳輸錯誤。
網路並不穩定時,先不要上傳數據,先將電腦關機再打開,或者重啟,連接比較好的網路連接,再進行傳輸數據即可。
NCBI有一個多學科的研究小組包括計算機科學家,分子生物學家,數學家,生物化學家,實驗物理學家,和結構生物學家,集中於計算分子生物學的基本的和應用的研究。這些研究者不僅僅在基礎科學上做出重要貢獻,而且往往成為應用研究活動產生新方法的源泉。
F. 如何將rna-seq的數據提交到ncbi中geo
其實很簡單,
1.首先建立一個meta file,即包含實驗信息的文件
2.將測序的fastq(*.fq或*.fastq)文件准備好,此為原始數據(必須)。
3.將每個fastq文件處理後(去接頭,合並相同序列)的序列整理為SEQ
COUNT兩列的文件即可,此為處理後數據(應該也是必須)
4.將這些文件壓縮為文件包(zip或RAR),命名為:賬戶名(你的GEO賬戶名).rar
5.上傳至ftp://geo:[email protected]/fasp,因為文件較大,推薦使用flashXP;除非網路好,超快。
6.寫一份郵件給GEO的網管:[email protected],說明你的數據已經上傳,讓其盡快發布,
我寫的例子:
Dear
Sir,
We would like to submit our Illumina Genome Analyzer results to your GEO
web site.
We have upload our data file zmyang_files.rar to ftp://geo:[email protected]/fasp under the
GEO account user name xxx.
xxx.rar includes:
Illumina meta file:
GEO_Illumina_metadata.xls
processed data
files:
x.txt
y.txt
z.txt
raw data files in fastq
format:
x.fq
y.fq
z.fq
We want to release our data ASAP.
Thanks.
該流程我已重復n次,親自手寫流程,保證可靠。
實際該流程在GEO網站是有個大概的,但是所言含糊,需分析邏輯而後得其詳。 轉載
G. 如何向NCBI上傳數據
許多期刊在文章發表之前需要在文章中有序列的登錄號,並且要求你在文章發表時,序列可以被讀者索取。
NCBI的GenBank提供了兩個投遞方式:
1、在線投遞-BankIt,特點是比較方便。
2、本地投遞文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其輸出文件需要你通過電子郵件發給NCBI.
另外,上面所述一般適用於研究單個或多個功能基因的情況。如果大規模的測序如EST、 STS和GSS序列分別有專門的投遞途徑。
另外,提醒你的兩個問題:
1、對你所投序列所屬物種分類(拉丁名)要有所了解,這通常是出錯的地方(seqin)
2、在你投遞序列到發表文章之間,要注意NCBI發給你的電子郵件,它會詢問你在什麼時間將序列公布。
具體細節你可以瀏覽參考資料所指連接。
H. ncbi上傳時gb文件怎麼來的
NCBI中查找序列號時導出來之後是.gb文件。
GenBank的文件。包含一個gene的名稱,編號,發現者,參考文獻,外顯子位置,編碼區序列,蛋白序列等等信息。
.gb文件用記事本就可以打開。
拓展:
NCBI位於馬里蘭州的貝塞斯達, 建立於1988年· NCBI保管GenBank的基因測序數據和Medline的生物醫學研究論文索引· 所有的這些資料庫都可以通過Entrez搜索引擎在線訪問。
國家生物技術信息中心(National Center for Biotechnology Information, 簡稱NCBI) 是美國國家醫學圖書館(NLM)的一部分(該圖書館是美國國家衛生研究所的一部分).