若干機器學習方法在RNA二級結構預測中的應用.pdf_第1頁
已閱讀1頁,還剩128頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著人類基因組計劃的成功實施,充分利用這些基因組測序數(shù)據,得到對人類有用信息的需求迅速增加,隨之而誕生的生物信息學充分利用信息技術、數(shù)學、生物學、計算機科學等多學科工具,有效分析了海量數(shù)據所包含的生物學意義。而機器學習方法則給生物信息學提供了可靠有力的算法支撐,使得生物信息學對生命科學的探索與研究做出了重大貢獻。本文利用了生物信息學中的若干種機器學習方法,研究了RNA的分子自折疊二級結構預測及RNA分子間靶位點堿基對匹配模式與靶點預測問

2、題。
  針對RNA二級結構預測算法中同源多序列保守結構預測法較單序列預測法復雜度高的問題,本文提出了保守二級結構中的保守堿基對來源于每個單序列的最優(yōu)和次優(yōu)自由能結構的假設。有效利用單序列自由能結構中各莖子結構的相關特征屬性信息,通過支持向量機算法,保守堿基對被挑選出來?;赗NA二級結構預測標準數(shù)據集和Rfam數(shù)據庫中十種RNA家族的二級結構預測實驗顯示,本算法的預測性能不低于主流預測算法水平。單序列自由能結構的引入既保證了較高

3、的保守結構預測性能,又在一定程度上降低了算法復雜度。另外,本文研究的粗糙集方法挑選保守堿基對以及依靠莖子結構的公共程度屬性排序挑選保守莖子結構法對SVM預測算法的最終形成提供了實驗基礎。
  在表示各個單序列最優(yōu)及次優(yōu)自由能結構的諸個莖子結構與保守二級結構的關系時,本文給出了一種有效的RNA二級結構表示方法,簡約點陣圖法,使得基于莖子結構粒度的預測算法原理描述更加形象與深刻。
  RNA分子間靶點預測亦主要依據RNA的一級序

4、列信息。對于miRNA靶位點堿基對互補配對模式特征的提取,本文先后使用了粗集工具與馬爾可夫鏈式模型工具研究了配對模式的定性與定量特征。本文首先借助于兩種量度變量,然后使用粗糙集工具,分析了miRNA的22個堿基中各個部分的匹配模式。接著,對miRNA靶點的序列匹配模式進行了進一步定量分析。通過建立馬氏鏈模型,對訓練數(shù)據進行學習,再根據極大似然法得到模型參數(shù)。已作完參數(shù)估計的模型為成熟的模型?;谶@個成熟模型的得分,制定出一個合適的閾值,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論