

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著人類基因組計劃的順利完成,科學家們獲得了大量的序列信息,進而人類由以基因組研究為主的時代踏進了以研究功能基因組為標志的后基因組時代。在后基因組時代里,蛋白質組學研究是生物信息學的重要分支之一,這是因為生物體內的各種生理功能的執(zhí)行都離不開蛋白質以及蛋白質與其它配體之間的協(xié)同合作。
蛋白質作為生命體的主要基本物質之一,其蛋白質間的相互作用不僅對細胞和生物通路的功能發(fā)揮著關鍵性的作用,而且理解這些相互作用對各種疾病的發(fā)病機理
2、和治療也具有極大的推進作用。因此蛋白質組學研究中一個最重要的挑戰(zhàn)就是如何從物理和結構層次上大規(guī)模地了解蛋白質-蛋白質之間的相互作用和構建相應的蛋白質相互作用網絡,一般常見的研究方法是根據其已知的蛋白質及其配體的一級結構序列,提取出序列中所包含的有用信息,利用實驗和計算方法結合這些信息來預測蛋白質之間發(fā)生相互作用的可能性并建立蛋白質相互作用網絡。隨著X 晶體衍射和核磁共振(NMR)實驗技術的進步,大量蛋白質結構數據被測定出來,這些數據信息
3、進一步促進了開發(fā)基于數據驅動的方法(計算方法)來預測蛋白質相互作用。
本文采用智能計算中相關的算法圍繞蛋白質相互作用里的一些基本問題進行著重研究。主要內容包括微觀層次上的蛋白質相互作用位點的預測、宏觀層次上的蛋白質相互作用預測以及蛋白質相互作用網絡的構建。針對這三方面的問題,我們分別進行了深入的分析并提出相對應的預測方法,詳細內容分別如下:
1.通過對蛋白質相互作用所形成的界面中表面殘基和界面殘基的分析,將覆
4、蓋算法引入到蛋白質相互作用位點預測中。該算法能夠很好地結合蛋白質相互作用界面上界面殘基在空間結構和一級序列結構中有聚類現象的特點,首先分別將界面殘基樣本和表面殘基樣本設想成在一個n 維空間的球面上(通過某種方式的轉換),然后提取兩種基本的蛋白質序列特征:序列譜和溶劑可及表面積。利用覆蓋算法從初始界面殘基樣本開始計算以該樣本為中心,以與異類樣本最近距離和與同類樣本最遠距離的一半作為半徑畫圓,構造一個覆蓋用以覆蓋同類樣本,然后再以異類樣本為
5、中心,以相同方式構造覆蓋,如此這樣交叉進行。我們根據數據特點,實驗分別構造了兩種數據集(完全集和平衡集),設計了該方法和傳統(tǒng)的機器學習算法(SVM,ME)在兩種數據集上的實驗。實驗結果顯示該算法在兩種數據集上的結果是有效的,可行的。最后給出幾種算法在兩個復合物上相互作用位點定位的實例,進一步說明該算法對未知蛋白質相互作用位點具有較強的適應性和預測能力。
2.可用于蛋白質相互作用位點預測的特征非常之多,不同的研究者使用不同的
6、特征組合從而得到不同的結果。由于各種特征從不同角度對蛋白質相互作用位點預測提供的信息都不盡相同,其中一些特征對分類器的預測能力毫無作用,甚至可能會降低預測結果。因此,我們針對蛋白質相互作用位點預測的特征選擇問題,提出了一種新的基于遺傳算法(GA)和支持向量機(SVM)相組合的特征提取算法。該算法利用GA 從原始基本特征所組成的110維蛋白質序列向量中提取出相對重要的68種特征,同時對提取出的特征采用SVM 進行評估。我們將個體的適應度評
7、價指標設置為算法分類能力的敏感度和特異度的均衡值F1-measure,這有利于尋找出對分類器各種性能指標相均衡的特征組合。實驗分別設計了隨機分類器、兩階段分類器、SVM和GA/SVM分類器。實驗結果表明,這種基于GA/SVM 特征提取算法的蛋白質相互作用位點預測方法具有較好的魯棒性,取得了比原始特征和其它方法更好的性能。
3.蛋白質相互作用預測的一個關鍵問題是如何有效地轉換相互作用的蛋白質序列對信息,因為不同的蛋白質序列信
8、息轉換方法所表達的信息量會大不相同,由此產生不同的分類性能。為此,我們提出了一種稱為氨基酸排序信息的蛋白質序列轉換方法(偽氨基酸組成,PseAA),這種方法不僅考慮到蛋白質序列的基本氨基酸組成,同時也把氨基酸間的短程、中程和遠程相互作用的影響放入蛋白質序列信息表達中。實驗采用SVM對新的蛋白質序列編碼方案進行學習和分類,同時為了與其它方法進行性能比較,實驗也設計了另外三種轉換方法,相關系數變換(CC)、自協(xié)方差表達變換(AC)和氨基酸組
9、成(AAC)。實驗結果表明,我們提出的序列編碼方案的分類性能在四種方法中居于第二,四種方法中AC 方法變換所產生的維數最高,達到了840;CC 方法次之,為420;AAC 方法最低,僅為40;我們提出的方法維數也只有100。因此,綜合其性能和所需的代價,我們提出的蛋白質相互作用序列轉換方法是有效的,可行的。
4.蛋白質相互作用預測僅僅是從蛋白質層次進行研究,而生命體的各種功能都與其細胞內蛋白質形成的相互作用網絡調控相關。為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于序列的蛋白質相互作用預測方法研究.pdf
- 蛋白質相互作用預測方法的研究.pdf
- 13608.基于進化計算的蛋白質相互作用預測方法研究
- 蛋白質-蛋白質相互作用界面和熱點預測的方法研究.pdf
- 基于蛋白質相互作用網絡的蛋白質功能預測.pdf
- 15854.蛋白質相互作用預測方法研究
- 蛋白質相互作用位點預測方法研究.pdf
- 基于貝葉斯方法的蛋白質相互作用預測研究.pdf
- 用生物統(tǒng)計方法預測蛋白質相互作用.pdf
- 基于信噪比的蛋白質相互作用的預測研究.pdf
- 蛋白質相互作用界面熱點殘基的預測研究方法.pdf
- 從蛋白質相互作用網絡預測未知蛋白質功能.pdf
- 基于蛋白質相互作用網絡及聚類算法的蛋白質功能預測方法研究.pdf
- 蛋白質相互作用
- 基于序列的蛋白質-藥物相互作用預測研究.pdf
- 基于蛋白質相互作用網絡的代謝pathway預測.pdf
- 蛋白質相互作用及其位點的預測方法研究.pdf
- 改進的蛋白質相互作用位點預測方法研究.pdf
- 基于機器學習的蛋白質類別及蛋白質-配體相互作用預測研究.pdf
- 基于pairwise核的蛋白質相互作用對稱預測研究.pdf
評論
0/150
提交評論