版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、蛋白質(zhì)的生物功能以其結(jié)構(gòu)為基礎(chǔ)。隨著人類(lèi)基因組計(jì)劃的順利實(shí)施,蛋白質(zhì)序列信息的積累速度遠(yuǎn)快于蛋白質(zhì)結(jié)構(gòu)數(shù)量的增長(zhǎng)速度。實(shí)驗(yàn)上研究蛋白質(zhì)結(jié)構(gòu)的主要手段有X射線晶體學(xué)技術(shù)、核磁共振衍射技術(shù)、電子纖維技術(shù)等。然而,通過(guò)實(shí)驗(yàn)手段確定蛋白質(zhì)的結(jié)構(gòu),不但成本高、耗時(shí),而且實(shí)驗(yàn)中還會(huì)遇到一些目前無(wú)法解決的技術(shù)困難,因此人們非常希望利用理論計(jì)算的方法直接從序列信息出發(fā)來(lái)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),這是生物信息學(xué)研究的重要課題之一。 目前,直接從氨基酸序列
2、信息出發(fā)來(lái)預(yù)測(cè)蛋白質(zhì)三級(jí)結(jié)構(gòu)還是有很多困難。更多的焦點(diǎn)集中在去預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)。由于二級(jí)結(jié)構(gòu)單元是多肽鏈在三維空間折疊的基本元素,二級(jí)結(jié)構(gòu)預(yù)測(cè)通常作為蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)的第一步,是蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)中重要的中間步驟,也是蛋白質(zhì)折疊理論研究的重要挑戰(zhàn)。 本文重點(diǎn)介紹了一種新的方法,即基于4肽結(jié)構(gòu)字的多樣性增量二次判別法(簡(jiǎn)稱(chēng)TPIDQD算法),對(duì)2個(gè)大小不同的數(shù)據(jù)庫(kù)進(jìn)行了二級(jí)結(jié)構(gòu)的預(yù)測(cè)。同時(shí)對(duì)325個(gè)標(biāo)準(zhǔn)樣本集合,進(jìn)行了二級(jí)結(jié)
3、構(gòu)和三級(jí)結(jié)構(gòu)關(guān)聯(lián)的研究。 (1)新的預(yù)測(cè)算法大體分三步:首先用定義的三種4肽結(jié)構(gòu)字(alpha、beta、coil)在序列中出現(xiàn)的頻次作為多樣源,從而建立標(biāo)準(zhǔn)源;然后用多樣性增量結(jié)合二次判別法對(duì)任何一個(gè)序列片段中心殘基的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè);最后進(jìn)行一些修正后處理,包括:消除預(yù)測(cè)中的結(jié)構(gòu)漲落以及用4肽邊界字來(lái)修正預(yù)測(cè)后的結(jié)構(gòu)邊界。 (2)用TPIDQD算法首次對(duì)CB513數(shù)據(jù)庫(kù)的二級(jí)結(jié)構(gòu)進(jìn)行了預(yù)測(cè),3折交叉檢驗(yàn)的預(yù)測(cè)精度
4、Q3達(dá)到79.19%。 (3)建立了一個(gè)新的包括1645個(gè)非冗余蛋白質(zhì)鏈的數(shù)據(jù)庫(kù),其中蛋白質(zhì)結(jié)構(gòu)分辨率高于3 Angstroms,序列相似性小于25%。用TPIDQD算法對(duì)其中21殘基片段中心殘基的結(jié)構(gòu)性質(zhì)進(jìn)行預(yù)測(cè),10折交叉檢驗(yàn)得到Q3為79.68%。當(dāng)考慮長(zhǎng)程序列信息時(shí),即取更長(zhǎng)的序列片段(大于21殘基長(zhǎng)度)來(lái)預(yù)測(cè)時(shí),結(jié)果將更好。同時(shí)隨著字庫(kù)的擴(kuò)大,用CB513庫(kù)作為訓(xùn)練集,對(duì)1645蛋白庫(kù)的交叉檢驗(yàn),也取得了79%的精度
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于二級(jí)結(jié)構(gòu)的蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 蛋白質(zhì)的二級(jí)結(jié)構(gòu)
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法研究.pdf
- 基于SVM的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 55775.蛋白質(zhì)二級(jí)結(jié)構(gòu)含量的預(yù)測(cè)
- 蛋白質(zhì)的結(jié)構(gòu)型、拓?fù)浣Y(jié)構(gòu)以及mRNA序列與蛋白質(zhì)二級(jí)結(jié)構(gòu)關(guān)系的研究.pdf
- 29899.蛋白質(zhì)超二級(jí)結(jié)構(gòu)預(yù)測(cè)研究
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)準(zhǔn)確率影響因素探討.pdf
- 基于支持向量機(jī)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)分類(lèi)的新方法.pdf
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)含量及膜蛋白類(lèi)型預(yù)測(cè).pdf
- 基于二級(jí)結(jié)構(gòu)元素的蛋白質(zhì)結(jié)構(gòu)比對(duì)算法.pdf
- 52532.蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)phd方法的改進(jìn)
- 基于覆蓋算法的蛋白質(zhì)二級(jí)結(jié)構(gòu)和結(jié)構(gòu)域預(yù)測(cè).pdf
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的信息統(tǒng)計(jì)迭代比對(duì)算法.pdf
- 基于遺傳算法的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)研究.pdf
- 蛋白質(zhì)二級(jí)結(jié)構(gòu)特征分析與相互作用預(yù)測(cè).pdf
- 基于分層神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 基于神經(jīng)網(wǎng)絡(luò)方法的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
評(píng)論
0/150
提交評(píng)論