代謝組學(xué)數(shù)據(jù)分析新方法.pdf_第1頁
已閱讀1頁,還剩116頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、代謝組學(xué)是系統(tǒng)生物學(xué)領(lǐng)域中繼基因組學(xué)、蛋白質(zhì)組學(xué)、轉(zhuǎn)錄組學(xué)之后發(fā)展起來的以代謝物組分析為基礎(chǔ),以高通量檢測和數(shù)據(jù)處理為手段,以信息建模與系統(tǒng)整合為目標(biāo)的新的交叉學(xué)科,已成為生命科學(xué)領(lǐng)域的研究熱點(diǎn)之一。
  數(shù)據(jù)分析在代謝組學(xué)研究過程中至關(guān)重要。隨著代謝組學(xué)研究的不斷深入,對數(shù)據(jù)分析提出了更高的要求。本論文對代謝組學(xué)數(shù)據(jù)分析中的幾個(gè)關(guān)鍵性問題進(jìn)行深入研究,主要成果包括:
  一、提出了基于信息熵的變量尺度縮放(variable

2、 scaling)方法。該方法從信息熵的角度出發(fā),在單位方差縮放法的基礎(chǔ)上,利用Kullback-Leibler(K-L)散度來度量變量的重要性,并對其進(jìn)行加權(quán)。由于K-L散度是在概率分布的意義上度量不同數(shù)據(jù)間的差異程度,因此對于高斯和非高斯分布的數(shù)據(jù)均適用,能準(zhǔn)確地度量不同實(shí)驗(yàn)分組樣品的差異性,從而更有效地地對譜數(shù)據(jù)的重要變量進(jìn)行識別和加權(quán)。以人群尿液的核磁共振(nuclear magnetic resonance,NMR)代謝輪廓數(shù)

3、據(jù)為例,實(shí)驗(yàn)結(jié)果表明:基于K-L散度的縮放方法能有效地改善多變量統(tǒng)計(jì)模型的性能,提高對特征代謝物的辨識能力。
  二、提出了基于局部特征信息提取的非負(fù)主成份分析(non-negative principalcomponent analysis,NPCA)和監(jiān)督的非負(fù)主成份分析(supervised NPCA,sNPCA)兩種多變量統(tǒng)計(jì)分析方法。NPCA方法是在對PCA負(fù)載矢量進(jìn)行非負(fù)正交限制來實(shí)現(xiàn)的;通過結(jié)合局部保持投影算法(lo

4、cality preserving projections,LPP)對NPCA方法進(jìn)行擴(kuò)展,實(shí)現(xiàn)了sNPCA方法;此外,文章中還提出了一種基于模型噪聲評估的模型優(yōu)化方法。利用模擬的NMR代謝組學(xué)數(shù)據(jù)和實(shí)驗(yàn)NMR代謝組學(xué)數(shù)據(jù)對這兩種方法性能進(jìn)行評估,結(jié)果表明這兩種方法都非常適合代謝組學(xué)數(shù)據(jù)分析。
  三、利用NMR和LC-MS/MS(liquid chromatography-tandem mass spectrometry,LC-

5、MS/MS)技術(shù)并結(jié)合相應(yīng)的模式識別方法對結(jié)直腸癌和結(jié)直腸息肉瘤進(jìn)行研究。對結(jié)直腸癌患者、息肉瘤患者和健康人的血清樣本同時(shí)采用NMR和LC-MS/MS技術(shù)進(jìn)行檢測,利用統(tǒng)計(jì)分析方法對三組數(shù)據(jù)兩兩進(jìn)行分析,不同檢測技術(shù)中獲取到的代謝物變量在串聯(lián)整合后,采用基于PLS-DA模型的后向變量刪除(backward variableelimination,BVE)方法對其進(jìn)行變量挑選,進(jìn)而獲取有效的代謝物變量子集用于分類建模。分析結(jié)果表明,數(shù)據(jù)整

6、合結(jié)合變量挑選可以顯著提高不同組樣本的可分性。
  四、提出了一種新的代謝通路分析方法。該方法利用代謝通路知識來指導(dǎo)代謝物濃度數(shù)據(jù)的統(tǒng)計(jì)建模,將數(shù)據(jù)統(tǒng)計(jì)分析與代謝通路分析合并為一步,與傳統(tǒng)的代謝組學(xué)數(shù)據(jù)統(tǒng)計(jì)分析中比較樣本間代謝水平差異的方法不同,該方法致力于比較樣本間代謝通路的差異。研究中采用模擬的代謝組學(xué)數(shù)據(jù)驗(yàn)證了該方法有效性,另外,該方法還被應(yīng)用于結(jié)直腸癌代謝組學(xué)數(shù)據(jù)的分析,并成功提取出與結(jié)直腸癌具有潛在關(guān)聯(lián)的代謝通路。作為一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論