兩種新的預測水平轉移基因的方法.pdf_第1頁
已閱讀1頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一個生物體內的大部分基因來自于線性遺傳后代,并分享著相同的理論進化過程,但它體內也有相當一部分基因并非源于線性遺傳,而是來自水平轉移過程,這些基因被稱為外源基因。識別這些由水平轉移過程所獲得的基因不僅對于重構生物體的進化歷史非常重要,同時也有助于我們更深入了解這類基因在生物體中的功能。 基于不同的理論基礎,我們建立了兩種新的水平轉移基因預測戰(zhàn)略,并將其運用于預測幾種藍藻(Cyanobacteria)基因組中的水平轉移基因。以下是

2、我們主要的研究內容和結果: 1.CGS(核心基因相似性)方法。在不同基因組中,核苷酸片段相對頻率會呈現(xiàn)出顯著的差異,本算法正是利用了這一特性。目前,也有其它一些方法(如CAI,W8等)利用了這一特性在基因組中識別外源基因,但這些方法都有同一個問題,即利用的是全部某一長度的核苷酸片段。由于全部的片段中有許多片段并不含信息,所以這些方法的噪音過高,降低了識別外源基因的能力。為解決這一問題,我們首先得出一組非常保守的訓練基因,這些基因

3、分別在13個不同的藍藻基因組中都有直向同源物,它們代表了藍藻的內源基因:接下來,我們在訓練基因中獲得了一組非常低頻的核苷酸片段,并利用這些片段去識別外源基因。在模擬試驗中,顯著水平低于10%時,CGS方法的功效在各種條件下都高于CB;當供體基因組和受體基因組的GC含量差異大時,CGS方法的功效高于W8;當供體基因組與受體基因組的GC含量差異小時,CGS方法的功效則高于C+G。據(jù)以上模擬結果顯示,W8和C+G算法受到供體與受體基因組GC含

4、量差異的顯著影響,但CGS方法卻非常穩(wěn)定,并且功效很高。盡管構建進化樹存在一些缺陷,但仍是目前最好的評估方法,因此我們利用了S8102作為真實的例子,采用構建進化樹的方法去評估CGS、W8、C+G、CB的功效。在S8102的系統(tǒng)樹分析過程中,G檢測的CGS方法略強于C+G,并明顯優(yōu)于W8和CB。就此,我們已使用BioLisp計算機語言開發(fā)了相關軟件,以供數(shù)據(jù)分析使用。 2.MGC(多基因組比較)方法。本算法基于如下假設:在同一物

5、種的不同菌株間,微生物染色體上的基因具有十分保守的共線性,水平基因轉移事件將使外源基因組整合進這些保守的基因組中。如果只利用兩個在進化上非常相近的基因組進行簡單的配對,將很難區(qū)分由于染色體的重排與丟失而造成的基因獲得與丟失。MGC方法能夠盡可能地避免由于基因丟失造成的錯誤外源基因島預測,從而改進了預測的準確性。當該方法被運用于PMED4時,我們的結果證實了早期曾提出過的一個觀點:tRNA是外源基因的整合熱點,許多基因組島被正向重復序列所

6、包圍。這些結果還表明,GI主要是通過遺傳重組被整合進入宿主基因組中。通過搜尋病毒基因組數(shù)據(jù)庫,我們發(fā)現(xiàn)PMED4的42個外源基因的同源基因存在于病毒基因組中,但是大部分的病毒基因組只有大的片段而沒有整個基因組,因而我們只能分析部分外源基因與病毒基因組的關系。通過分析21個外源基因的進化樹,我們還發(fā)現(xiàn)7個病毒基因組中存在的外源基因的同源基因可能是來自藍藻。這些外源基因在病毒中存在,顯示這些基因可能對病毒有某些好處,并在病毒中發(fā)揮著重要的功

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論