當前位置:首頁 » 文件管理 » 上傳dna序列

上傳dna序列

發布時間: 2024-12-28 08:27:42

㈠ 如何向NCBI提交基因組序列

1.整理序列信息:包括病原採集地、病原的寄主、寄主症狀、採集人等基本信息;還有序列分析結果,包括序列全長大小,開放閱讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸序列等基因水平的信息,這對於接下來的快速准確提交序列及提交成功後為全世界其他作者准確全面分享此類信息很重要;

2.登陸BackIt站點,注意到頁面右邊的「Sign in to use BankIt」標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與NCBI賬號不通用)。

附 注冊賬號步驟,需要填寫的項目為:

Title:你的職位或頭銜

First name:名

last name:姓

login:登陸名

Affiliation:所屬機構地址,一般填寫自己學校地址

E-mail Address:通信電郵,填完後會發隨機密碼到此電郵地址,使用隨機密碼進行登陸,當然登陸後可對密碼進行重置;

3.登陸BankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:

接下來共有九個步驟(好事多磨):

3.1 Contact Information

填寫個人姓名、機構、電郵等資料集聯系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;

3.2 Reference

填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入「Direct Submission」),有的話就填寫已發表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發現者等信息,填寫完畢點擊CONTINUE;

※提示:新版的BankIt中,接下來會有「Sequencing Technology」一項,呈現有454、Illumina、SOLiD及Other等測序方法選擇,目前為「Sanger dideoxy sequencing」即一代測序方法測序,並且所提交的序列均為「assembled sequences」,目前的「assembly program」為「Lasergene,version 7.0」。

3.3 Nucleotide

包括三個小項:Submission Release Date(期望NCBI什麼時候公布你的序列)、16S
rRNA submissions(該序列是否為16S rRNA)、Sequence(s) and Definition
Line(s)(會提示問你該序列是否為全長genomic
DNA、線狀或環狀等、序列長度,需要復制序列或提交FASTA格式文件),如若序列長度與復制序列或FASTA文件長度不同則會有提示,需要重新提交序列,依次選擇即可。一般選擇「Immediately after Processing」,「非16S rRNA」,「genomic DNA」,「circular」,「complete」等信息,然後將全序列粘貼到下方的空格中,別忘了在上方寫上總核苷酸數。完後審查看有沒有錯誤,繼續CONTINUE;

3.4 Organism

填寫Organism(病原物)的名字,即序列公開顯示時候的標題(如MYVYNV分離物序列「Malvastrum yellow vein Yunnan virus isolate SC226-5, complete genome"),點擊CONTINUE後會出現自動檢索項目,核對後(有可能會進行選擇)繼續CONTINUE;

3.5 Submission Category

提交范疇,是否直接提交或通過第三方Annotation提交(不是太清楚什麼意思,可能指的是從EMBL和DDBJ中導入的數據吧),一般為直接提交,如下圖示選擇Original,繼續CONTINUE;

3.6 Source modifier

選擇該病原物的種類,比如質粒、線粒體等;

Source
modifier下拉菜單及後面的Value設置:進一步選擇該病原物獲取信息,比如Country、Host、Clone、Collection
date、Strain/Isolate等,至少三項(Organelle/Location為細胞器/位置,該項可以不填寫),否則該項不通過,盡量信息全面真實,需要繼續添加則點擊Add,填寫完畢查看下方已填寫表格進行信息核對,然後CONTINUE;

3.7 Primers

PCR引物項目,可選項目,不想填寫可CONTINUE;

3.8 Features(※)

該步驟重要!將用到之前准備的內容,比如序列內ORFs等信息的填寫,並根據之前的選項來填寫該步驟,比如需要將DNA翻譯為氨基酸序列並進行復制粘貼等,該步操作只需將之前准備信息錄入即可,比較耗時;

點擊下方「ADD」鍵,頁面將切換為↓

在這里我們需要錄入更多與該序列有關的信息,最主要的就是錄入之前已經整理好的序列裡面的開放閱讀框(ORF)信息:Genetic Code設置為」Standard「,5'和3'都勾選上,Protein Name/Protein Description項都填寫,將特定區域(ORF)的核苷酸序列翻譯為氨基酸序列後(除去末端的終止子)復制到下方的」Amino Acid Sequence「框中,依次錄入即可。在這里越詳細越好,具體參照實際操作;

3.9 Review and Correct

對已填寫信息進行復核及提交,並被告知在2個工作日之內會收到NCBI電郵,需要進一步對序列進行審查核對;

4.至此,基本序列提交已經完工,剩下的事情就是等待審核,大概兩個工作日後會收到來自NCBI工作人員的電郵,如有問題會通知你進一步修改信息直到完全無誤,包括以後的接受序列號,即你的序列會出現在NCBI裡面世界上唯一的一個界面里。

㈡ NCBI|線粒體基因組數據上傳

NCBI葉綠體基因組的上傳步驟示例

准備工作

首先,需要登錄NCBI官網,點擊「sign in to NCBI」並選擇登錄方式。通常使用常見郵箱登錄即可。然後點擊上傳數據,開始上傳流程。

上傳步驟

在上傳任務概覽頁面,完成一系列信息填寫。首先,在「Contact」部分填寫聯系人的詳細信息,包括姓名、學校、地址等,確保信息准確無誤。

在「Refrence」部分,填寫提供序列的作者姓名。

接著,在「Sequencing Technology」部分,根據實際情況填寫測序平台、組裝情況、組裝軟體、版本、樣本名、覆蓋率等信息。確保信息真實有效。

進入「Nucleotide」階段,需填寫序列發表的時間、分子類型(選擇「genomic DNA」)、拓撲結構(選擇「circle」),以及是否提交完整的細胞器基因組序列(對於線粒體基因組,選擇「Yes」)。同時上傳序列文件(要求為.fasta格式),注意在文件第一行加上拉丁文的物種名。

在「Submission Category」中,選擇投稿的類別,通常選擇「Original」。

進入「SourceModifiers」階段,填寫源細胞器/位置信息(選擇「mitochondrion」),並填寫「country」作為Source Modifier值,以「china」為例。

「Features」部分需要上傳tbl文件,通常需要將gbf文件轉換為tbl格式。使用在線轉換工具,上傳線粒體的注釋文件,填寫相關信息後下載轉換後的.tbl文件。

最後,完成信息查看與確認,無誤後提交,等待郵件通知。

完成上傳後,可以通過登錄提交頁面查看記錄和相關文件。

希望以上NCBI葉綠體基因組上傳步驟示例能對您有所幫助。

㈢ 在NCBI上提交DNA序列前,標記DNA怎麼做呢

1、登陸NCBI官網:網頁鏈接

2、輸入fasta文件或者是直接在搜索欄搜索該基因;

3、點擊genbank,找到基因序列;

4、當前頁點擊ctrl+F,輸入序列的具體信息就可以搜到你想要的序列。

但是您說的像是在提交前標記,這個恐怕是不行的,因為提前標記要麼是截取一段固定的序列進行上傳然後比對。提前標記在後面分析的時候也是顯示不出來的,所以建議在找到序列後標記,或者就是已知固定序列比對,保存前後序列。

熱點內容
掛qphp 發布:2025-03-14 10:13:12 瀏覽:640
資料庫關系表示 發布:2025-03-14 10:13:11 瀏覽:232
腳本抖音號 發布:2025-03-14 10:11:07 瀏覽:668
演算法第 發布:2025-03-14 04:40:56 瀏覽:227
天選2什麼配置好 發布:2025-03-14 03:37:17 瀏覽:287
魅族手機怎麼找回密碼 發布:2025-03-14 02:35:48 瀏覽:298
配置高低主要看什麼 發布:2025-03-14 01:49:22 瀏覽:88
locpython 發布:2025-03-14 01:12:50 瀏覽:352
java數組的定義方法 發布:2025-03-14 00:53:25 瀏覽:527
壓縮性綳帶 發布:2025-03-14 00:30:21 瀏覽:187