基于多階信息的復(fù)雜疾病分子網(wǎng)絡(luò)研究.pdf_第1頁
已閱讀1頁,還剩104頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著生物信息的發(fā)展和多層次高通量組學(xué)數(shù)據(jù)的出現(xiàn),生命科學(xué)研究進(jìn)入了大數(shù)據(jù)時(shí)代,同時(shí)也面臨著新的革命。生物分子層面的研究模式從單個(gè)分子擴(kuò)展到多個(gè)分子以及它們之間的相互作用。計(jì)算系統(tǒng)生物學(xué)為挖掘生物大數(shù)據(jù)提供了數(shù)學(xué)理論基礎(chǔ)與方法儲(chǔ)備。尤其,網(wǎng)絡(luò)作為刻畫大數(shù)據(jù)關(guān)系的有力工具,逐漸被應(yīng)用于分析各種高通量生物數(shù)據(jù)。其中,復(fù)雜疾病作為威害人類健康的主要?dú)⑹郑渲虏C(jī)理、早期診斷和后期治療成為生物醫(yī)學(xué)最關(guān)注的研究領(lǐng)域。如何從分子網(wǎng)絡(luò)角度結(jié)合高通量生物

2、組學(xué)數(shù)據(jù)來研究復(fù)雜疾病的發(fā)病機(jī)制及致病基因是目前亟待解決的問題。
  本文主要利用復(fù)雜網(wǎng)絡(luò)本身的數(shù)學(xué)特性,結(jié)合生物高通量組學(xué)數(shù)據(jù),建立了針對(duì)復(fù)雜疾病的新型分子網(wǎng)絡(luò)模型,并對(duì)疾病的致病機(jī)理、早期診斷及富集的生物通路進(jìn)行了深入研究?,F(xiàn)有的大多數(shù)疾病分子網(wǎng)絡(luò)模型,無法真實(shí)地反映現(xiàn)實(shí)網(wǎng)絡(luò)的隨機(jī)波動(dòng)和噪音。對(duì)此,我們提出利用生物組學(xué)數(shù)據(jù)的多階統(tǒng)計(jì)信息來構(gòu)建分子網(wǎng)絡(luò)模型,并提出具體的分析算法。其次,我們針對(duì)臨床樣本數(shù)據(jù)少這一現(xiàn)實(shí),利用多階統(tǒng)計(jì)

3、信息構(gòu)建了單樣本分子網(wǎng)絡(luò):差異網(wǎng)絡(luò)模型,并利用該模型對(duì)生物通路富集問題進(jìn)行了深入研究。本文的主要研究成果有:
  1.利用生物組學(xué)數(shù)據(jù)(主要是基因表達(dá)數(shù)據(jù))的一階、二階統(tǒng)計(jì)信息,建立了新型的多階信息分子網(wǎng)絡(luò)。利用數(shù)據(jù)的多階信息,盡可能地還原生物分子網(wǎng)絡(luò)的真實(shí)發(fā)展過程。通過對(duì)多階信息分子網(wǎng)絡(luò)理論與應(yīng)用的研究,我們發(fā)現(xiàn),結(jié)合了二階統(tǒng)計(jì)信息的生物分子網(wǎng)絡(luò)(邊網(wǎng)絡(luò))能更好地縮小對(duì)致病基因的搜索范疇,從而能更精確地找到與疾病相關(guān)的致病基因。

4、通過對(duì)H3N2流感病毒感染后的時(shí)序基因表達(dá)數(shù)據(jù)的分析,我們發(fā)現(xiàn),通過邊網(wǎng)絡(luò)模型找到的疾病基因不僅能有效預(yù)測(cè)病毒感染的發(fā)生與否,還能盡可能早地給出預(yù)測(cè)結(jié)果。也就是說這些基因在對(duì)H3N2流感感染的早期預(yù)測(cè)上具有高效的生物標(biāo)記功能。
  2.從單樣本數(shù)據(jù)出發(fā),利用多階統(tǒng)計(jì)信息構(gòu)建了單樣本分子網(wǎng)絡(luò)。不同于基礎(chǔ)理論研究,臨床診斷中的實(shí)際樣本數(shù)量是極其有限的,單樣本分子網(wǎng)絡(luò)將為復(fù)雜疾病分子網(wǎng)絡(luò)模型的實(shí)際應(yīng)用創(chuàng)造條件。通過設(shè)計(jì)合理的可加性量化指

5、標(biāo),我們發(fā)現(xiàn),整合了基因表達(dá)值與基因表達(dá)相關(guān)性值而構(gòu)建的差異表達(dá)網(wǎng)絡(luò)能更全面地提取正常與疾病生物分子網(wǎng)絡(luò)之間的差異信息,從而提高疾病預(yù)測(cè)的精度及魯棒性。在對(duì)前列腺癌及糖尿病的疾病數(shù)據(jù)分析中,我們?nèi)〉昧溯^豐富的工作成果:全面評(píng)估了各種差異信息對(duì)疾病預(yù)測(cè)的貢獻(xiàn);挖掘了具有顯著生物意義的差異模塊;識(shí)別了與疾病異質(zhì)性相關(guān)的生物功能模塊,例如可變剪切;篩選了高精度且具有魯棒性的生物標(biāo)記模塊。
  3.為了進(jìn)一步比較多階信息分子網(wǎng)絡(luò)與傳統(tǒng)的一

6、階信息網(wǎng)絡(luò),基于差異表達(dá)網(wǎng)絡(luò)開發(fā)了集成生物通路富集分析模型及算法。傳統(tǒng)的生物通路富集分析僅僅考慮了點(diǎn)網(wǎng)絡(luò)中一階信息上的差異,而集成生物通路富集分析將同時(shí)考慮二階信息上的差異。這為解釋復(fù)雜疾病分子網(wǎng)絡(luò)的生物意義提供了新的視角。通過設(shè)計(jì)針對(duì)雙重差異的超幾何檢驗(yàn)指標(biāo),我們發(fā)現(xiàn),整合了表達(dá)均值差異與表達(dá)方差差異的集成生物通路富集分析算法,在異質(zhì)性樣本中的富集分析能力顯著提高。在模型評(píng)估中,我們?cè)诖罅考膊?shù)據(jù)上對(duì)現(xiàn)有的多種生物通路富集分析方法進(jìn)行

7、了比較,其結(jié)果體現(xiàn)了集成生物通路富集分析算法的優(yōu)勢(shì)和擴(kuò)展性。在對(duì)典型的異質(zhì)性疾病-糖尿病的研究中,集成生物通路富集分析有效地識(shí)別出了異常調(diào)控的生物通路及這些通路標(biāo)記下的潛在糖尿病亞型。
  綜上,我們對(duì)復(fù)雜疾病分子網(wǎng)絡(luò)的研究,為理解疾病的致病機(jī)理和疾病的早期預(yù)測(cè)做出了一定的貢獻(xiàn)。多階信息分子網(wǎng)絡(luò)(邊網(wǎng)絡(luò))將更全面地包含生物組學(xué)數(shù)據(jù)中的信息,從而可以為疾病研究定位更少更精確的致病候選基因,同時(shí)也為疾病預(yù)測(cè)提供了更精細(xì)的分析手段。單樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論