基于神經網絡的蛋白質二級結構預測研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質二級結構預測問題是生物信息學的重要問題之一。本文對蛋白質二級結構預測問題進行了研究,建立了蛋白質二級結構預測數據庫。研究了蛋白質的基本組成成分氨基酸的編碼方式?;贑PN神經網絡建立了單神經網路和多神經網絡的預測模型。并利用它們對蛋白質二級結構進行了預測研究。其主要研究內容和成果如下: (1) 人工神經網絡的研究。論文對神經網路的建模方法進行了理論分析探討,得出概率神經網絡、GMDH網絡、LVQ網絡、CPN網絡適合用來進行

2、蛋白質二級結構預測,但由于不同網絡的形成的機制不同,對于處理本文所使用的編碼數據時,會產生不同的問題。因此,在進行了不同方法的具體實驗之后,總結出了效果最好的一種網絡結構-CPN網絡結構。 (2) 蛋白質二級結構評測數據庫的建立。論文首先從同源蛋白質數據庫(Homology Derived Secondary Structure ofProteins,簡稱HSSP)中提取出36個蛋白質文件:針對其包含復雜的數據形式,設計了一個提

3、取數據的方法,對蛋白質數據進行預處理,提取出氨基酸序列。建立了由這些氨基酸序列構成的數據庫。為蛋白質二級結構預測打下了良好的基礎。 (3) 5種氨基酸編碼方式的比較研究。論文針對正交編碼、5位編碼、Codon(基本型)編碼、Codon(擴展型)編碼及Profile編碼等5個常用的編碼方法。利用CPN神經網絡,建立了蛋白質二級結構預測的評測模型。運用該模型研究分析了這5種編碼方式對蛋白質二級結構預測精度的影響。結果表明,用富含“生

4、物進化信息”的Profile編碼方式可以得到較高的預測結果。 (4) 基于多神經網絡的蛋白質二級結構預測模型。論文提出了一個由7個CPN神經網絡組合成的多神經網絡的蛋白質二級結構預測模型,該模型采用“profile”編碼方式和氨基酸間的“距離”為激勵輸入信息,對蛋白質二級結構進行了預測。論文對從36個蛋白質提取的共4000個氨基酸的進行了預測研究和分析。結果表明:本文的多神經網絡優(yōu)于Zhu等人提出的多神經預測模型[19],它把蛋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論