基于數(shù)據(jù)融合的共調控基因挖掘方法研究.pdf_第1頁
已閱讀1頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、21世紀是生命科學和信息技術的世紀,共調控基因挖掘是生物學家在基因功能關聯(lián)領域研究工作的核心之一。DNA微陣列芯片的發(fā)展使作為生物信息學數(shù)據(jù)源的表達水平數(shù)據(jù)已經(jīng)能夠通過生物學實驗海量提取。利用這些數(shù)據(jù)分析調控因子如何對若干基因進行表達調控,可以構建基因調控網(wǎng)絡,而構建基因調控網(wǎng)絡是挖掘共調控基因的主要任務之一。共調控基因指的是一組基因的集合,這組基因在生物細胞中被相同調控因子進行調控,控制其在轉錄或翻譯階段的表達,進而影響細胞執(zhí)行其相應

2、功能。構建基因調控網(wǎng)絡并挖掘其中的共調控基因,可以從分子水平上理解生物體的生理活動和功能,了解生物體如何根據(jù)基因的不同表達而產生的變化。
  從表達水平數(shù)據(jù)中計算共表達團,得到轉錄調控模塊是目前普遍使用的挖掘共調控基因的方法。然而大部分共調控基因不僅在表達水平上具有相似模式,而且在生命體的某一過程當中具有相似功能,所以同時利用表達水平數(shù)據(jù)與本體數(shù)據(jù)來挖掘共調控基因,能夠更準確地分析和發(fā)現(xiàn)基因間的共調控關系。
  本文針對共調

3、控基因的挖掘,分別從表達譜相似性、本體相似性與綜合網(wǎng)絡集中頻繁稠密子圖挖掘三個方面進行了研究:
  (1)通過對共調控基因在表達譜中的表達相關性進行研究,定義了一種基于子空間搜索的基因表達譜相似度計算方法。首先搜索基因的樣本空間,找出待搜索基因的相關空間,其次計算此相關子空間上基因表達水平的相似性,從而解決了共調控基因相似性計算中的正反共調控和部分時間共調控的發(fā)掘問題。
  (2)由于基因本體(GeneOntology,GO

4、)能夠更統(tǒng)一高效地注釋基因產物,所以利用它提供的豐富信息來預測基因之間的功能關聯(lián)。通過對基因本體結構進行分析研究,提出一種基于語義分化的基因本體語義相似性度量方法。本方法引入了語義分化因子與最短路徑的概念,對每個術語所含有的信息量重新定義,使每個術語在GO圖中擁有固定的信息量,并采用節(jié)點的子孫節(jié)點的個數(shù)比來定義邊的語義分化因子。該方法融合了節(jié)點之間的信息量與路徑雙重語義,充分考慮了術語在GO拓撲結構上的位置信息,更能夠反應生物體之間的關

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論