版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著人類基因組全序列測(cè)序與工作草圖的完成,基因組學(xué)研究的重心已逐漸由結(jié)構(gòu)基因組學(xué)向功能基因組學(xué)轉(zhuǎn)移,生物醫(yī)學(xué)隨之進(jìn)入一個(gè)新紀(jì)元--后基因組時(shí)代。在后基因組時(shí)代,一個(gè)重要任務(wù)就是對(duì)蛋白質(zhì)組學(xué)的研究。得益于越來越多的高通量實(shí)驗(yàn)技術(shù)的出現(xiàn)和日臻成熟,目前已積累了大量的蛋白質(zhì)組數(shù)據(jù)。當(dāng)前的問題是,分析和研究這些數(shù)據(jù)的手段和能力嚴(yán)重滯后,使得花費(fèi)大量人力和財(cái)力獲得的數(shù)據(jù)未能產(chǎn)生更多有生物學(xué)意義的結(jié)果。因此,發(fā)展先進(jìn)高效的信息分析和數(shù)據(jù)挖掘手段,從
2、大量而繁雜的蛋白質(zhì)組數(shù)據(jù)中找出內(nèi)在聯(lián)系,以揭示蛋白質(zhì)的功能及相互作用關(guān)系具有極其重要的意義。 蛋白質(zhì)相互作用是分子生物學(xué)研究的熱點(diǎn)及難點(diǎn)。蛋白質(zhì)作為最主要的生命活動(dòng)載體和功能執(zhí)行者,對(duì)其復(fù)雜多樣的結(jié)構(gòu)功能、相互作用和動(dòng)態(tài)變化進(jìn)行深入研究,有助于在分子、細(xì)胞和生物體等多個(gè)層次上全面揭示生命現(xiàn)象的本質(zhì)。蛋白質(zhì)相互作用是生物體中眾多生命活動(dòng)過程的重要組成部分,是生物體生化反應(yīng)的基礎(chǔ),是后基因組時(shí)代的主要任務(wù)。實(shí)驗(yàn)方法提供大量數(shù)據(jù)的同時(shí)
3、,會(huì)帶來大量的假陽性和假陰性數(shù)據(jù)。因此,本文從計(jì)算的角度來研究蛋白質(zhì)相互作用,主要研究和探索了機(jī)器學(xué)習(xí)方法對(duì)蛋白質(zhì)-蛋白質(zhì)相互作用的預(yù)測(cè)問題。本文的工作主要包括以下幾個(gè)方面: 1)提出了一種新的基于氨基酸進(jìn)化保守性的蛋白質(zhì)相互作用預(yù)測(cè)方法。由于自然選擇法則的作用,在一個(gè)蛋白質(zhì)家族中與分子功能相關(guān)的氨基酸殘基在進(jìn)化過程中呈現(xiàn)保守性特征,蛋白質(zhì)與外界的作用依賴于這些關(guān)鍵的殘基。我們從蛋白質(zhì)序列出發(fā),提出一種新的基于氨基酸序列相關(guān)系數(shù)
4、的編碼方式,該編碼方式同時(shí)考慮序列內(nèi)部長程相互作用和序列之間的協(xié)同進(jìn)化關(guān)系。對(duì)于正負(fù)學(xué)習(xí)樣本,分別考慮來自DIP,MIPS與BIND數(shù)據(jù)庫的正樣本和四種不同方式構(gòu)建的負(fù)樣本,包括:通過隨機(jī)選取蛋白質(zhì)構(gòu)造R-NEG;通過亞細(xì)胞定位方式,利用位于同一個(gè)亞細(xì)胞區(qū)間的蛋白質(zhì)對(duì)構(gòu)造IS-NEG;通過亞細(xì)胞定位方式利用位于不同亞細(xì)胞區(qū)間的蛋白質(zhì)對(duì)構(gòu)造BS-NEG;通過基因本體信息得到的具有較低RSSBP與RSSCC值的蛋白質(zhì)來構(gòu)造GO-NEG。MI
5、PS Core和GO-NEG這一種組合方式與另外十一種組合方式相比預(yù)測(cè)準(zhǔn)確率最高,并且有統(tǒng)計(jì)學(xué)意義的P值最小,分別稱MIPS Core和GO-NEG為黃金正樣本和黃金負(fù)樣本。與已知的氨基酸殘基自相關(guān)編碼方式相比,相關(guān)系數(shù)編碼方式得到較好的預(yù)測(cè)結(jié)果。對(duì)于跨模式生物的預(yù)測(cè)結(jié)果表明,基于相關(guān)系數(shù)編碼方式的SVM模型具有較好的泛化能力。 2)構(gòu)建了一個(gè)改進(jìn)的GPCA plus LDA預(yù)測(cè)模型來預(yù)測(cè)蛋白質(zhì)相互作用,能夠有效地提高膜蛋白相互
6、作用的預(yù)測(cè)精度。Greedy KPCA(GPCA)得到的基坐標(biāo)直接來源于樣本數(shù)據(jù),而KPCA算法得到的基坐標(biāo)來自于樣本數(shù)據(jù)的線性組合。盡管基于貪婪算法的KPCA算法是次優(yōu)的,但是與傳統(tǒng)的KPCA算法相比能夠極大地降低計(jì)算復(fù)雜度。對(duì)于酵母這一典型的單細(xì)胞模式生物,大多數(shù)酵母整合膜蛋白無法通過實(shí)驗(yàn)方法來驗(yàn)證。我們提出利用膜蛋白相互作用的21個(gè)結(jié)構(gòu)與序列特征,來構(gòu)造56個(gè)正樣本和150個(gè)負(fù)樣本,實(shí)驗(yàn)表明基于GPCA plus LDA預(yù)測(cè)模型得
7、到包括189個(gè)膜蛋白300對(duì)具有高可靠性的預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果也表明,盡管GPCA plus LDA方法進(jìn)行了特征約簡,同時(shí)有效地降低了數(shù)據(jù)之間的冗余性,但得到的結(jié)果比LDA方法略優(yōu);GPCA plus LDA方法由于解決了高階信息丟失問題,得到的結(jié)果與KPCA plus LDA方法相比有了很大的改善與提高;GPCA plus LDA方法得到的預(yù)測(cè)正確率方差最小,表明十次測(cè)量值之間存在較小的差異,該方法具有較好的魯棒性。通過計(jì)算揭示了膜蛋
8、白相互作用網(wǎng)絡(luò)具有小世界效應(yīng)和無標(biāo)度特性。 3)提出了一種新的基于貝葉斯累加回歸樹計(jì)算模型(BART)的蛋白質(zhì)相互作用預(yù)測(cè)方法。BART是一種新穎的集成學(xué)習(xí)方法,通過非參數(shù)化的貝葉斯回歸方法,把累加回歸樹計(jì)算模型分解為若干個(gè)弱分類器,并通過集成方法整合為一個(gè)分類器集成系統(tǒng)?;谡螹CMC算法的BART預(yù)測(cè)模型用于蛋白質(zhì)相互作用預(yù)測(cè),獲得了較好的預(yù)測(cè)準(zhǔn)確率。與標(biāo)準(zhǔn)的MCMC方法相比,提出的整合MCMC算法能夠有效地避免局部極小情
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 蛋白質(zhì)-蛋白質(zhì)相互作用界面和熱點(diǎn)預(yù)測(cè)的方法研究.pdf
- 15854.蛋白質(zhì)相互作用預(yù)測(cè)方法研究
- 基于序列的蛋白質(zhì)相互作用預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法研究.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的蛋白質(zhì)功能預(yù)測(cè).pdf
- 用生物統(tǒng)計(jì)方法預(yù)測(cè)蛋白質(zhì)相互作用.pdf
- 蛋白質(zhì)相互作用界面熱點(diǎn)殘基的預(yù)測(cè)研究方法.pdf
- 從蛋白質(zhì)相互作用網(wǎng)絡(luò)預(yù)測(cè)未知蛋白質(zhì)功能.pdf
- 蛋白質(zhì)相互作用
- 基于智能計(jì)算的蛋白質(zhì)相互作用預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)相互作用及其位點(diǎn)的預(yù)測(cè)方法研究.pdf
- 改進(jìn)的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)相互作用預(yù)測(cè)及其應(yīng)用的研究.pdf
- 蛋白質(zhì)相互作用界面中熱點(diǎn)殘基預(yù)測(cè)方法的研究.pdf
- 基于貝葉斯方法的蛋白質(zhì)相互作用預(yù)測(cè)研究.pdf
- 蛋白質(zhì)相互作用預(yù)測(cè)方法的研究與蛋白質(zhì)超二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)的開發(fā).pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)及聚類算法的蛋白質(zhì)功能預(yù)測(cè)方法研究.pdf
- 基于信噪比的蛋白質(zhì)相互作用的預(yù)測(cè)研究.pdf
- 基于序列的蛋白質(zhì)-藥物相互作用預(yù)測(cè)研究.pdf
- 基于機(jī)器學(xué)習(xí)的蛋白質(zhì)類別及蛋白質(zhì)-配體相互作用預(yù)測(cè)研究.pdf
評(píng)論
0/150
提交評(píng)論