基于de Bruijn圖的DNA多序列比對并行算法研究.pdf_第1頁
已閱讀1頁,還剩119頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多序列比對是目前生物信息領域研究的重要課題之一,在基因識別、蛋白質結構預測等領域有著廣泛的應用。由于問題本身所固有的復雜性,至今還沒有一個令人滿意的算法,同時隨著生物數(shù)據(jù)的不斷增長,串行算法已不能滿足人們的需求。本課題重點研究了如何利用de Brujin圖進行多序列比對及其并行化處理方案,提出了一個新的多序列比對并行算法PL_GAlign。課題的主要工作與貢獻.如下:
   在基于圖論的算法中引入了距離參數(shù)并采用了改進的星形比對

2、算法:詳細分析了目前使用比較廣泛的多序列比對算法,但是常用的并行劃分策略對該類算法的執(zhí)行效果較差。因此重點研究了基于圖論的多序列比對算法并對其進行了改進:為了更好的適應基因的變異性,在該類算法中引入了距離參數(shù)d,將現(xiàn)有算法的精確匹配修改為允許一定誤差的模糊匹配。在應用 de Bruijn圖得到中心序列后,摒棄了現(xiàn)有算法中常用的動態(tài)規(guī)劃算法,采用了更為適合這種情況的星型比對算法并對其進行了改進,從而使該算法的時間復雜度降低至幾乎線性。

3、r>   針對算法中的各個階段提出了并行處理策略:針對多序列比對的高計算復雜性問題,研究了基于 de Bruijn圖的并行化處理方案。分別對基于圖論的多序列比對算法中的構建 de Bruijn圖、去環(huán)、尋找最大權值路徑和兩兩比對階段的串行處理過程和可并行性進行了探討,提出了各個階段的并行處理策略。
   最后進行了一系列數(shù)據(jù)測試,實驗結果證明PL GAlign算法在運行速度上要優(yōu)于現(xiàn)有的迭代法,尤其當輸入序列較長且數(shù)目較多時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論