生物信息學的應用方法和技術

在生物信息學研究中,常用的方法和技術如下:

1. 數學統計方法

數學統計在生物信息學中是一種最常用的方法。例如,在分析DNA語言中的語義、分析密碼子使用頻率、利用馬爾科夫模型進行基因識別時都要用到數學統計方法。

2. 動態規劃方法

動態規劃(Dynamic Programming)是一種通用的優化方法,其基本思想是:在狀態空間中,根據目標函數,通過遞推,求出一條從狀態起點到狀態終點的最優路徑(代價最小的路徑)。動態規劃在生物信息學研究中用得最多的方面是DNA序列或者蛋白質序列的兩兩對比排列。

3. 模式識別技術

模式識別是在輸入樣本中尋找特徵拼識別對象的一種技術。模式識別主要有兩種方法,一種是根據統計特徵進行識別,另一種是根據對象的結構特徵進行識別,而後者常用的方法為句法識別。在基因識別中,對於DNA序列上的功能位點和特徵信號的識別都需要用到模式識別。

4. 數據庫技術

在生物信息學中,數據庫技術是最基本的技術。生物分子信息的存儲、管理、查詢等功能是建立在數據庫管理系統之上。目前的分子信息數據庫大都採用關係數據庫管理系統。

5. 人工神經網絡技術

人工神經網絡是對大腦神經網絡的模擬,這種模擬既是在功能上的,也是在結構上,這與傳統的串行計算機有著本質的區別。神經網絡計算不僅計算速度快,重要的是它更具有智能。從應用來看,神經網絡計算在優化和模式識別方面具有非常強的能力。在生物信息學研究中,無論是基因識別還是蛋白質結構預測,神經網絡都取得了比其它方法更為準確的結果。

6. 分子模型化技術

分子模型化是利用計算機分析分子結構的一種技術。包括顯示分子的三維結構,顯示分子的理化或電子學特性,將分子小片段組裝成更大的分子片段或完整的分子結構。利用分子模型化軟件,用戶可以通過交互操作平移、旋轉和縮放分子的三維結構,從不同的角度觀察分子構像和形狀。對於DNA分子,我們可以直觀地觀察雙螺旋結構,看到兩條鏈的走向,還可以研究堿基之間的氫鍵配對。對於蛋白質分子,既可以觀察其結構骨架,可以觀察其外觀形狀,也可以研究其活性部位或結合部位的結構。

7. 分子力學和量子力學計算

在分子構像優化研究方面必須要用量子力學或分子力學。結構優化工作按理應該用量子力學來完成,但是由於生物大分子體系太復雜,包含幾千個原子,超過了目前量子力學方法可以處理的體系範圍,所以研究生物大分子的構像,主要還是用基於半經驗勢函數的分子力學方法,而量子力學則在確定勢函數的參數和研究局部性質時起作用。

8. 分子動力學模擬

分子動力學模擬是一種重要的統計物理方法,在物理和化學上早有應用。用此方法可以研究蛋白質的構像,對蛋白質進行動力學研究。這是利用計算機進行模擬實驗的基礎。

9. 專家系統

專家系統將有關專家的知識和經驗以一定的知識表示形式(如產生式規則、語義網絡等)存放在計算中,在用戶需要時,以智能的方式幫助解決問題,提供參考性決策。專家系統是人工智能領域里的一個重要分支,在生物信息學研究中也有著應用,如用於基因識別。

10. 互聯網技術

目前,分子生物學研究人員進行信息交流特別是生物分子數據的交流,都是通過互聯網實現的。在大多數情況下,用戶可以從互聯網上查到你所想要的生物分子數據,如原始的序列和結構數據,經過加工處理以後的數據。同時,用戶也可以將所要處理的數據直接送到相應的網絡伺服器上,伺服器接受你的處理請求後,會將處理結果送回給用戶。