如何在伺服器上進行序列比對
① MEGA | 多序列比對及系統發育樹的構建
MEGA 是一款用於多序列比對、可視化和構建系統發育樹的免費軟體。自1993年發布以來,已更新至11版,新版針對處理大規模數據集進行了優化。相比其他工具如DNAMAN和Jalview,MEGA具有獨特優勢。
MEGA可在Win、Mac和Linux系統上運行,用戶可從官網下載。安裝完成後,即可進行操作。
多序列比對時,選擇首頁的"ALIGN"功能,點擊"Edit/Build Alignment",在彈出窗口中選擇"Create a new alignment"。用戶需根據比對的序列類型(氨基酸或核苷酸)選擇"DNA"或"Protein"。導入序列文件(格式為.fasta),然後選擇ClustalW或其他比對方法進行多序列比對,結果會直觀顯示。
構建系統發育樹需要基於多序列比對結果。用戶可調整參數,選擇最大似然法、鄰接法或最小進化法進行分析。重復構建進化樹以進行檢驗,一般選擇1000次以上比較可靠。構建完成後,用戶可修改樹中的文字,保存為PDF、PNG、TIFF等格式或復制到Word中進行編輯。
DNAMAN、Jalview和MEGA在多序列比對功能上各有優勢。DNAMAN優勢在於輸出的矢量圖易於調整序列名稱和順序。Jalview擁有豐富比對方法和演算法,圖形美觀且支持輸出Sequence logo圖。MEGA的序列比對圖更美觀,專業進化分析功能強大。
在基因組學領域,涉及外顯子、基因組、蛋白質生物學、文獻解讀、資料庫、期刊、分析技術、分析平台、Linux操作系統、RStudio、伺服器管理、理論與技術培訓、遺傳咨詢、政策法規等多方面知識。
MEGA軟體提供了多序列比對和系統發育樹構建的強大工具,為基因組學研究提供了便利。不同工具各有特色,選擇合適的工具取決於具體研究需求。基因組學領域的知識涵蓋了從基礎概念到高級分析技術,從數據管理到法規政策,涉及廣泛的研究內容。
② Multalin方法原理
MultAlin方法基於雙重比對的思路,首先將序列進行分層次聚類,每個聚類後進行多序列比對,計算新比對值,並根據這些值調整樹形結構。這個過程不斷迭代,直到比對值不再上升,比對結束。在實際操作中,用戶在INRA Toulouse的環球網點上,只需將FASTA格式的序列粘貼到輸入框,選擇輸出格式、輸入格式、分值矩陣(通常根據序列間的相似性選擇)以及空位開放和擴展的得分值。提交後,伺服器會返回多序列比對結果,如圖8.1的CLUSTAL W比對的序列,通過MultAlin伺服器處理,其結果如圖8.2所示,一致序列中的匹配和差異用特定符號表示。
然而,MultAlin與CLUSTAL W的比對結果有所差異。CLUSTAL W在果蠅序列中允許了兩個超過10個鹼基的空位,而MultAlin僅開放了一個。MultAlin還提供了額外20個完全匹配的殘基。這並不意味著一種方法優於另一種,因為選擇方法取決於輸入序列的特性。謹慎的用戶會結合使用多個工具,對結果進行人工修正以獲取最佳比對效果。每個方法都有其適用場景,選擇適合的方法至關重要。