版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著環(huán)境微生物研究的發(fā)展和高通量測序技術的出現(xiàn),微生物的研究迎來了宏基因組學的技術研究時代。突破傳統(tǒng)微生物學研究方法的瓶頸,宏基因組學直接研究環(huán)境微生物的基因組。近年來大量研究表明,人體的多種疾病與人體類各個器官的微生物群落是息息相關的,而宏基因組樣本分類方法成為研究微生物群落與宿主或環(huán)境關系的重要研究手段:通過提取宏基因組樣本的特征,結合分類算法鑒定樣本類別。目前宏基因組樣本分類方法大多使用微生物的全基因組序列,本文深入研究了基于16
2、S rRNA基因序列微生物群落分析方法,建立了一套基于16S rRNA基因序列的樣本分類流程,并將分析與分類方法應用到小鼠及人類腸道微生物群落的研究中。
樣本分類的重要前提是對不同狀態(tài)的樣本提取一種具有顯著差異性的特征。本文深入研究不同樣本的16S rRNA基因序列,通過模擬數(shù)據(jù)分析驗證群落結構作為樣本特征的可行性。分析結果表明,物種豐度包含了樣本中微生物的物種數(shù)目、比例,是最基本的樣本特征;α多樣性提煉了樣本的物種豐度信息,
3、降低了樣本特征維數(shù),是一種較為重要的樣本特征;β多樣性特征同時結合了群落獨立進化信息(UniFrac)和物種豐度,是較為理想的樣本特征。
結合隨機森林算法和三種有效的樣本特征,我們建立了一套基于16S rRNA基因序列的樣本分類流程。通過對不同參數(shù)的模擬數(shù)據(jù)集的分類實驗,我們比較了樣本類別數(shù)、特征的類間方差、類內方差以及系統(tǒng)發(fā)育樹高度對分類流程準確率的影響。最終的分類結果表明,在樣本特征類間差異不明顯,即類內特征方差大、類間特
4、征方差小的情況下本文所建立的分類流程分類準確率比其他分類方法高;在樣本類別數(shù)增加、群落進化關系復雜等情況下,本文所建立的流程較其他分類方法表現(xiàn)更好。實驗結果表明我們設計的宏基因組樣本分類流程具有良好的分類性能,能夠準確鑒別基于16S rRNA序列的宏基因組樣本。
將所建立的基于16S rRNA基因序列的宏基因組樣本分類分析流程分別應用于小鼠和人類腸道微生物樣本。實驗結果表明我們發(fā)展的分類流程對與環(huán)境相關的小鼠腸道微生物樣本分類
5、準確率高于88%,能夠準確地對小鼠腸道宏基因組樣本中微生物群落所生存的環(huán)境類別進行區(qū)分。同時分類結果表明:特征向量的類間方差小的兩組樣本錯分而導致的樣本分類錯誤較多;不同環(huán)境下小鼠腸道微生物樣本的群落獨立進化信息(UniFrac)對樣本差異性的體現(xiàn)不如物種進化關系。對于與肥胖相關的人類腸道微生物樣本,我們發(fā)展的流程的分類準確率達到75%以上,基本能夠鑒定人類腸道宏基因組樣本中微生物群落的宿主的體型類別。同時分類結果還表明:過重組和肥胖組
6、兩類樣本組的特征向量的類間方差低而經常導致樣本錯分;肥胖相關人類腸道微生物樣本的群落獨立進化信息作為樣本特征的分類性能要優(yōu)于微生物物種進化信息,我們認為群落獨立進化信息更能體現(xiàn)有著不同身體質量指數(shù)人群的腸道微生物差異。綜合兩組數(shù)據(jù)實驗結論如下:首先,樣本特征的類間方差對分類準確率影響較大,類間方差較小的兩組樣本容易錯分而導致分類準確率降低;其次,我們設計的流程不論基于哪一種樣本特征,分類性能都要比基于支持向量機的分類流程出色;最后,對于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 近海細菌多相分類和基因組研究以及深海沉積物宏基因組分析.pdf
- 宏基因組樣本分類方法研究.pdf
- 寧夏野鳥攜帶病毒宏基因組分析.pdf
- 基于嗜耐鹽菌基因組分析與深海宏基因組文庫的酯酶研究.pdf
- 宏基因組數(shù)據(jù)分析中的統(tǒng)計方法研究.pdf
- 封閉人群兒童口腔微生物與齲病關系的宏基因組分析.pdf
- 基于小波變換表觀基因組分析方法的研究.pdf
- 基于特征向量的宏基因組測序序列分類算法研究.pdf
- 玉米和棉花DGAT基因家族的全基因組分析.pdf
- 昆蟲基因組注釋方法改進及兩種昆蟲基因組分析.pdf
- 宏基因組測序講解
- 青枯菌基因組分析.pdf
- 擬南芥、水稻和楊樹ACTIN家族全基因組分析.pdf
- 真菌宏基因組的靶向探針技術和樣本數(shù)據(jù)分析.pdf
- 基于DArT芯片及葉綠體基因組分析的柑橘屬植物進化與分類研究.pdf
- 灰飛虱線粒體基因組分析.pdf
- 14492.3β羥基莪術醇衍生物抗單純皰疹病毒體內藥效研究和云南蜱樣本宏基因組分析
- 宏基因組學方法在環(huán)境微生物生態(tài)及基因查找中的應用研究.pdf
- 腸道菌群與冠心病的宏基因組關聯(lián)分析.pdf
- 利用宏基因組方法分析堆肥生境中微生物區(qū)系的變化.pdf
評論
0/150
提交評論