版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、蛋白質(zhì)是生命的物質(zhì)基礎(chǔ)。如何理解蛋白質(zhì)序列,結(jié)構(gòu)和功能三者的關(guān)系是生物信息學(xué)研究的重要問題。本文致力于研究蛋白質(zhì)序列和結(jié)構(gòu),序列和功能之間的關(guān)系。本研究主要結(jié)果由以下四部分組成:
㈠提出了一個(gè)快速的蛋白質(zhì)結(jié)構(gòu)比對(duì)算法。通過利用蛋白質(zhì)殘基的二面角來代表蛋白質(zhì)的三維結(jié)構(gòu),利用動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)來比對(duì)二面角序列。我們證明了在PDB-select數(shù)據(jù)庫中不同蛋白質(zhì)比對(duì)后的得分服從參數(shù)為
2、μ=94.7697,σ=41.5837,ζ=0.1925的廣義的極值分布(Generalized ExtremeValue Distribution,GEVD).通過該分布還可以計(jì)算蛋白質(zhì)結(jié)構(gòu)比對(duì)的結(jié)構(gòu)差異性的統(tǒng)計(jì)顯著性。該比對(duì)得分對(duì)蛋白質(zhì)分類還有很好的應(yīng)用。和其他結(jié)構(gòu)比對(duì)算法如CTSS等相比,我們的算法更具有統(tǒng)計(jì)意義和時(shí)間效率。
㈡蛋白在細(xì)胞生命活動(dòng)中扮演著重要的角色。為了利用序列信息來區(qū)分膜蛋白功能,我們提出一種基于快
3、速傅里葉變換特征的機(jī)器學(xué)習(xí)方法對(duì)來自膜轉(zhuǎn)運(yùn)蛋白分類數(shù)據(jù)庫(Transport Classification Database,TCDB)中的三類主要膜轉(zhuǎn)運(yùn)蛋白進(jìn)行功能分類。使用快速傅罩葉變換(Fast Fourier Transform,FFT)將20種氨基酸的分布,殘基的疏水性,平均極性和溶劑化自由能的原始特征數(shù)據(jù),轉(zhuǎn)化為頻域上的信息作為支持向量機(jī)的輸入。我們的模型在五倍交叉檢驗(yàn)(five-fold crossvalidation)預(yù)
4、測(cè)準(zhǔn)確率分別達(dá)到了72.1%,在相同數(shù)據(jù)集下,比Gromiha et al.等工作的準(zhǔn)確率提高了4%。本文的研究證明我們的模型可以有效地對(duì)膜轉(zhuǎn)運(yùn)蛋白的三種主要功能進(jìn)行分類。
㈢提出了兩個(gè)模型對(duì)蛋白質(zhì)折疊問題進(jìn)行預(yù)測(cè)。第一個(gè)是基于局部結(jié)構(gòu)信息熵的模型:從AAindex數(shù)據(jù)庫中的531種殘基物理化學(xué)性質(zhì),序列長度信息和局部結(jié)構(gòu)信息熵中篩選特征,分別針對(duì)三種折疊機(jī)制two-state,multi-state和mixed-stat
5、e的蛋白質(zhì)預(yù)測(cè)其折疊速率,用Jackknife驗(yàn)證模型真實(shí)值與預(yù)測(cè)值之間的相關(guān)系數(shù)達(dá)到0.790,0.829和0.778。和其他模型相比,我們的模型具有輸入?yún)?shù)少,計(jì)算簡(jiǎn)單,平均絕對(duì)誤差小的優(yōu)點(diǎn)。另一個(gè)是基于序列信息出發(fā),考慮殘基的二級(jí)結(jié)構(gòu),殘基柔性和溶劑可及性提出一個(gè)模型PFR-AF,PFR-AF也是針對(duì)三種不同的折疊機(jī)制來分別預(yù)測(cè)三種蛋白質(zhì)的折疊速率。PFR-AF模型有較高的相關(guān)性(0.71到0.95),并且平均絕對(duì)誤差較小(0.7
6、5到0.9),我們的模型還解釋了對(duì)于two-state折疊的蛋白增加處在蛋白質(zhì)表面的丙氨酸(Ala)可以加快折疊速率,而增加異亮氨酸(Ile)的含量,則可能降低折疊的速率。我們觀還察到coil的柔性可以加快折疊過程,處在蛋白質(zhì)表面的strands的含量則會(huì)降低速率。通過增加處在multi-state蛋白質(zhì)表面的柔性會(huì)延長折疊過程。multi-state蛋白質(zhì)二級(jí)結(jié)構(gòu)starnds的柔性也會(huì)減慢折疊過程。另外還提供了兩個(gè)例證來驗(yàn)證模型的正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 蛋白質(zhì)編碼序列對(duì)蛋白質(zhì)折疊速率的影響.pdf
- 蛋白質(zhì)折疊速率預(yù)測(cè)方法研究.pdf
- 基于扭轉(zhuǎn)參數(shù)預(yù)測(cè)蛋白質(zhì)折疊速率.pdf
- 蛋白質(zhì)結(jié)構(gòu)折疊分析與速率預(yù)測(cè).pdf
- 基于神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)折疊速率預(yù)測(cè).pdf
- 基于蛋白質(zhì)網(wǎng)絡(luò)與蛋白質(zhì)功能的關(guān)鍵蛋白質(zhì)預(yù)測(cè)研究.pdf
- 24208.基于構(gòu)象量子躍遷的蛋白質(zhì)折疊速率研究
- 蛋白質(zhì)折疊
- 基于結(jié)構(gòu)的蛋白質(zhì)折疊類型分類建模與識(shí)別.pdf
- 蛋白質(zhì)動(dòng)力學(xué)與蛋白質(zhì)折疊的理論研究.pdf
- 蛋白質(zhì)序列數(shù)據(jù)的分類預(yù)測(cè)研究.pdf
- 基于序列編碼的蛋白質(zhì)分類問題研究.pdf
- 基于蛋白質(zhì)序列和生物醫(yī)學(xué)文獻(xiàn)的蛋白質(zhì)功能挖掘.pdf
- 影響蛋白質(zhì)折疊速率因素的統(tǒng)計(jì)分析.pdf
- 基于序列特征的蛋白質(zhì)分子功能預(yù)測(cè).pdf
- 蛋白質(zhì)折疊類型分類及其Profile HMM識(shí)別.pdf
- 蛋白質(zhì)的分類
- 基于序列特征的蛋白質(zhì)功能類預(yù)測(cè)方法研究.pdf
- 基于SVM的蛋白質(zhì)折疊子識(shí)別研究.pdf
- 基于壓縮感知的蛋白質(zhì)功能分類預(yù)測(cè).pdf
評(píng)論
0/150
提交評(píng)論