ncbi序列上傳
㈠ 如何向NCBI提交序列
1.整理序列信息:包括病原採集地、病原的寄主、寄主症狀、採集人等基本信息;還有序列分析結果,包括序列全長大小,開放閱讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸 序列等基因水平的信息,這對於接下來的快速准確提交序列及提交成功後為全世界其他作者准確全面分享此類信息很重要;
2.登陸BackIt站點,注意到頁面右邊的「Sign in to use BankIt」標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與ncbi 賬號不通用)。
附 注冊賬號步驟,需要填寫的項目為:
Title:你的職位或頭銜
First name:名
last name:姓
login:登陸名
Affiliation:所屬機構地址,一般填寫自己學校地址
E-mail Address:通信電郵,填完後會發隨機密碼到此電郵地址,使用隨機密碼進行登陸,當然登陸後可對密碼進行重置;
3.登陸BankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:
接下來共有九個步驟(好事多磨):
3.1 Contact Information
填寫個人姓名、機構、電郵等資料集聯系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;
3.2 Reference
填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入「Direct Submission」),有的話就填寫已發表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發現者等信息,填寫完畢點擊CONTINUE;
※提示:新版的BankIt中,接下來會有「Sequencing Technology」一項,呈現有454、Illumina、SOLiD及Other等測序方法選擇,目前為「Sanger dideoxy sequencing」即一代測序方法測序,並且所提交的序列均為「assembled sequences」,目前的「assembly program」為「Lasergene,version 7.0」。
㈡ 如何將基因序列上傳到Genebank
有兩中方法可以提交你的序列:1、進入NCBI網站,左側有sequence submissions ,點擊進入Submit to GenBank利用BankIt在線投遞,特點是比較方便,你按照程序的說明一步步跟著操作就可以了,滿簡單的。2、從NCBI的ftp上下載提交序列的軟體sequin,利用軟體進行提交。NCBI的ftp地址是ftp.ncbi.nih.gov如果只提交單條序列,可以到NCBI站點用方法1直接提交。如果批量提交很多條序列,建議用sequin軟體,這樣更具有效率。
㈢ ncbi提交序列問題
這封郵件是告訴你已經提交序列成功了,查找這個序列的ID (也就是 Genbank accession number
)是
BankIt1691102 BankIt1691102 KJ195333 (Genbank accession number一般是2位字母+6位數字,即KJ195333, 前面那一串不知道是什麼東東)
你或者別人寫文章的時候引用你提交的序列時需要註明這個Genbank accession number。
你可以在Genbank向公眾釋放這些序列前提交你的文章。
你上傳的結果並不會自動錄入Genbank。Genbank有專門的工作人員會檢查你上傳的序列以及做好注釋。
由於你沒有指定你提交的序列什麼時候向公眾發表,所以NCBI那邊的人默認是他們把這些數據處理好就自動向公眾發表(也就是大家都可以查得到),若果你不想這樣,請發郵件給他們([email protected])。更多內容請見他們帖出來網址。
大概就是這樣。
㈣ 細菌基因組上傳NCBI(一)(GenBank)
進行細菌基因組測序項目的科研工作者在提交研究時,經常會遇到編輯要求上傳基因組序列至NCBI,並提供基因組數據登錄號的指示。對於初次涉及此過程的學者來說,確實會感到困惑。上傳基因組至NCBI主要涉及三個步驟:BioProject、BioSample、GenBank。
BioProject主要用於描述測序基因組所屬的研究背景。在這個環節,你需填寫項目背景信息,包括聯系人基本信息、項目數據類型、物種名稱、項目基本信息等。
BioSample則用於描述測序樣本的背景信息。具體操作與BioProject相似,只需填寫相關信息即可。
GenBank部分是上傳組裝完成的基因組數據,包括WGS草圖或完成圖。
開始上傳流程之前,需要注冊My NCBI賬號,通過NCBI主頁右上角的「Sign in to NCBI」進行注冊。注冊過程簡單,不再贅述。
在完成BioProject和BioSample的申請後,便可以開始上傳基因組至GenBank。
進入上傳界面後,首先選擇「submitter」和「general info」等基本信息。重點在於准備.sqn文件,這一步驟至關重要。
准備文件需要生成兩個主要文件:.sbt文件和genome.fsa文件。.sbt文件包含作者信息,通過指定網站填寫完成。genome.fsa文件則包含物種、菌株名稱和是否環狀的信息。接著,使用tbl2asn工具生成.sqn文件,具體命令如下:
tbl2asn -t genome.sbt -p ./ -a r1k -M n -l paired-ends -V vb -Z discrep
下載tbl2asn工具請訪問ftp.ncbi.nih.gov/toolbo...。工具使用方法請參閱ncbi.nlm.nih.gov/genban...
完成.sqn文件的生成後,上傳至NCBI指定位置,繼續完成後續的上傳流程。整個細菌基因組上傳過程至此完成。
總的來看,僅僅上傳基因組序列並不復雜,而上傳包含注釋信息的基因組則相對更為復雜。後續將專門探討這部分內容。