關(guān)聯(lián)分析和基因組預(yù)測相關(guān)方法的探討與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩104頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)聯(lián)分析和基因組預(yù)測是對植物復(fù)雜數(shù)量性狀進(jìn)行基因鑒定和遺傳改良的重要方法。自2001年以來,應(yīng)用關(guān)聯(lián)分析方法發(fā)掘植物數(shù)量性狀基因就備受關(guān)注,大量的方法以及軟件包已經(jīng)涌現(xiàn),統(tǒng)計功效和運(yùn)算效率也隨之增加,然而針對多位點(diǎn)、多性狀的關(guān)聯(lián)分析還未受到廣泛關(guān)注。此外,近年來,基因組預(yù)測也成為國際植物基因組學(xué)研究的熱點(diǎn),不同于傳統(tǒng)的標(biāo)記輔助選擇,基因組預(yù)測利用染色體組上的全部的標(biāo)記信息來預(yù)測植物自交系或者雜種后代的表現(xiàn),能夠大大縮短育種時間,從而有效

2、降低了育種成本。大量的參數(shù)方法、半?yún)?shù)及非參數(shù)方法已用于基因組選擇。隨著分子生物技術(shù)的發(fā)展,能夠獲得各種組學(xué)的數(shù)據(jù),包括代謝組和轉(zhuǎn)錄組等,這為表型預(yù)測提供了新數(shù)據(jù)源。但如何有效利用這些組學(xué)數(shù)據(jù)以及預(yù)測方法,還未見系統(tǒng)的比較以及應(yīng)用?;诖?,本文基于LASSO和偏最小二乘分別提出了多位點(diǎn)和多性狀的關(guān)聯(lián)分析方法,旨在提高關(guān)聯(lián)分析的檢驗(yàn)功效;此外,本文分別基于玉米自交系群體以及雜交水稻群體對多種統(tǒng)計方法和不同組學(xué)數(shù)據(jù)的預(yù)測力進(jìn)行比較,并利用相

3、關(guān)組學(xué)信息預(yù)測了水稻重組自交系群體所有潛在雜交種的產(chǎn)量。研究內(nèi)容主要包括以下兩個方面:
  一、多位點(diǎn)和多性狀關(guān)聯(lián)分析
  (1)基于LASSO的多位點(diǎn)關(guān)聯(lián)分析方法。多位點(diǎn)的關(guān)聯(lián)分析方法能同時考慮所有位點(diǎn),并且不涉及多重測驗(yàn)校正,因此與單位點(diǎn)方法相比具有更高的檢測功效。本研究將LASSO方法用于關(guān)聯(lián)分析,并首次采用兩種顯著性測定方法檢驗(yàn)LASSO方法中位點(diǎn)的顯著性,分別為基于bootstrap的LASSO-A和基于混合模型方

4、程的LASSO-B,并通過模擬研究比較了基于混合線性模型的GEMMA方法和LASSO方法的檢驗(yàn)功效和假發(fā)現(xiàn)率。模擬結(jié)果表明LASSO-A方法具有最高的檢驗(yàn)功效以及最低的假發(fā)現(xiàn)率,即使位點(diǎn)的表型貢獻(xiàn)率很低,LASSO仍可以檢測到。本文利用LASSO-A、LASSO-B和GEMMA方法對422份油棕材料的13個經(jīng)濟(jì)性狀進(jìn)行GWAS,LASSO方法共檢測到19個與經(jīng)濟(jì)性狀相關(guān)的標(biāo)記位點(diǎn),很大一部分在前人通過連鎖分析獲得的QTL附近,而GEMM

5、A方法僅檢測到三個顯著SNP,并且均被LASSO方法檢測到。在LASSO方法檢測到的顯著位點(diǎn)中,一些位點(diǎn)具有一因多效性,控制了多個性狀,并且這些性狀間也顯著相關(guān)。無論在模擬數(shù)據(jù)還是實(shí)際數(shù)據(jù)中,LASSO均有較高的檢驗(yàn)功效,該方法是對現(xiàn)有關(guān)聯(lián)分析方法的一個很好的補(bǔ)充。
  (2)基于多元偏最小二乘的多性狀聯(lián)合關(guān)聯(lián)分析。在實(shí)際育種工作中,經(jīng)常要同時考慮多個復(fù)雜性狀。多性狀聯(lián)合分析既可利用性狀之間的遺傳相關(guān)又可利用環(huán)境相關(guān)信息,可有效提

6、高分析結(jié)果的精確度。本文提出了用于優(yōu)異等位基因挖掘和遺傳效應(yīng)估計的多性狀聯(lián)合關(guān)聯(lián)分析方法,該方法采用多元偏最小二乘和兩階段變量選擇策略,結(jié)合BIC信息準(zhǔn)則進(jìn)行最優(yōu)模型中變量的選擇,通過計算機(jī)模擬在不同樣本大小,遺傳力以及PIC下研究該方法的可行性,并與單性狀多位點(diǎn)關(guān)聯(lián)分析進(jìn)行結(jié)果比較。結(jié)果表明:相比于單性狀分析,多性狀聯(lián)合分析可以提高檢測功效,尤其對一因多效基因優(yōu)勢更加明顯;樣本容量、遺傳力、PIC以及效應(yīng)值的大小均對候選基因的統(tǒng)計功效

7、、效應(yīng)估計值的準(zhǔn)確度和精確度具有重要影響。
  二、基因組預(yù)測方法比較研究及其應(yīng)用
  (1)玉米自交系中組學(xué)預(yù)測的統(tǒng)計方法比較。為了更好地了解不同組學(xué)數(shù)據(jù)和不同方法的預(yù)測準(zhǔn)確性,本文利用339個玉米自交系中測量得到100K個SNP,28769個轉(zhuǎn)錄產(chǎn)物,748個代謝物作為數(shù)據(jù)源,采用8種預(yù)測方法對6個玉米農(nóng)藝性狀進(jìn)行預(yù)測,并比較不同數(shù)據(jù)來源和不同方法的預(yù)測效果。方法包括LASSO,最佳線性無偏預(yù)測(BLUP),BayesA

8、,BayesB,偏最小二乘法(PLS)以及再生核希爾伯特空間(RKHS)和支持向量機(jī)(SVM-RBF和SVM-POLY)。結(jié)果表明在玉米自交系農(nóng)藝性狀的預(yù)測中,BLUP方法在所有組學(xué)和性狀的綜合預(yù)測效果最好,基因組預(yù)測較代謝組和轉(zhuǎn)錄組的預(yù)測效果好。本文將所有組學(xué)數(shù)據(jù)合并后對6個性狀進(jìn)行預(yù)測,發(fā)現(xiàn)預(yù)測力沒有明顯提高。此外,為了更好的了解性狀的遺傳結(jié)構(gòu),對6個性狀進(jìn)行了全基因組關(guān)聯(lián)分析,同時利用LASSO方法檢測出對農(nóng)藝性狀有顯著影響的代謝

9、物。最后,根據(jù)不同的閾值進(jìn)行了標(biāo)記的篩選,并利用篩選后的標(biāo)記進(jìn)行了基因組預(yù)測,通過交叉驗(yàn)證發(fā)現(xiàn)預(yù)測效果沒有明顯改善。
  (2)雜交水稻產(chǎn)量及其相關(guān)性狀的組學(xué)預(yù)測。利用水稻的基因組,轉(zhuǎn)錄組以及代謝組的數(shù)據(jù)對水稻雜交種的產(chǎn)量及其構(gòu)成性狀進(jìn)行預(yù)測并對預(yù)測效果進(jìn)行評價。本文從210份水稻重組自交系親本中有可能產(chǎn)生的21495個雜交種中,隨機(jī)選擇278份材料進(jìn)行表型鑒定,并利用這278份材料作為訓(xùn)練樣本來預(yù)測所有可能樣本的產(chǎn)量相關(guān)性狀,發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論