版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、利用混合線性模型進行遺傳數(shù)據(jù)分析對于統(tǒng)計學家和遺傳學家來說都是一種挑戰(zhàn),因為無論是線性、二次性還是似然估計方法都會在很大程度上受到自變量或依變量中的異常數(shù)值的干擾。要了解異常值對分析結(jié)果的影響,唯一的方式是通過反復地數(shù)據(jù)質(zhì)量鑒定和模型優(yōu)化?;谏鲜隹紤],本研究借助于MINQUE(最小二次范數(shù)無偏估計)和AUP(調(diào)整的無偏預測)方法(表示為:方法Ⅰ),提出了利用混合線性模型進行遺傳數(shù)據(jù)分析的異常值檢測方法,并將該方法與基于EM算法和BLU
2、P(最佳線性無偏預測)的方法(表示為:方法Ⅱ)進行比較,然后通過兩個實例分析來驗證方法。 本研究首先利用一個常用的遺傳模型(包括品種、年份和地點)來演示該方法,并引入一組統(tǒng)計量來評價異常值對分析結(jié)果的影響程度,如:Cook距離(CD(β)),Andrews-Pregibon統(tǒng)計量(AP),Cook-Weisberg統(tǒng)計量(CW)和方差比例(VR)是用來評價某個數(shù)據(jù)點對混合線性模型種固定效應的影響;而Cook距離(CD(e))是用
3、來評價某個數(shù)據(jù)點對隨機效應的影響。采用C++編程語言編寫了計算機模擬程序,通過蒙特卡羅模擬方法產(chǎn)生模擬數(shù)據(jù),隨機設定若干異常值,并運用本研究提出的方法來檢測異常值,來檢驗方法的有效性和可靠性。結(jié)果表明,利用上述的異常值評價指標,方法Ⅰ和方法Ⅱ都能夠檢測到模擬數(shù)據(jù)中人為設定的異常值,兩者具有相似的異常值檢測能力。 此外,本研究還運用方法Ⅰ和方法Ⅱ?qū)Σ缓挟惓V档臄?shù)據(jù)進行分析,來比較兩種方法的假陽性率。結(jié)果表明,與方法Ⅱ相比,利用方
4、法Ⅰ所得到的異常值評價指標更加平穩(wěn),因此,方法Ⅰ在異常值檢測方面更加穩(wěn)健。另外,在模擬數(shù)據(jù)中,針對特定品種、年份和地點的組合設定異常值。大多數(shù)情況下,方法Ⅰ和方法Ⅱ都能檢測到這類異常值,對于有些例子,方法Ⅰ能夠具有更強的檢測能力,而對于另一下例子,方法Ⅱ則表現(xiàn)的更好。主要分析結(jié)果可總結(jié)如下: 1)本研究提出的方法可以較好地檢測出混合線性模型中的異常表型值。如果模型中只存在少量離散的異常觀察值,無論用方法Ⅰ還是用方法Ⅱ,都能檢測到
5、這些異常值。但如果一個品種在同一地點、同一年份存在多個異常值,則無法檢測到這些異常值,反正會將正確的觀察值判定為異常值。 2)基于上述方法,本研究采用C++編程語言編寫了一套計算機程序,用于混合線性模型的遺傳數(shù)據(jù)分析,檢測異常觀測值,并根據(jù)統(tǒng)計檢驗P值的大小來排列異常值。這套程序也可以提供模型中方差分量的估計值和隨機效應的預測值。 3)在常用遺傳模型的分析結(jié)果中,有些值異常值會由于其他異常值的掩蓋而無法被檢測出來,而有些
6、正常的觀察值則會由于其它多個異常值的影響而被誤認為是異常值。 4)在常用遺傳模型的分析實例中,異常值的存在可能會嚴重影響固定效應的估計和隨機效應的預測,而去掉這些異常值之后,則可能在很大程度上改進模型的參數(shù)估計。對于QTL定位數(shù)據(jù),去除異常值之后,可以檢測到額外的QTL,并能改進遺傳率的估計。兩個實例分析的結(jié)果都表明,去除異常值之后,都能改進模型的參數(shù)估計,當然,我們并不能武斷地認為這些去除異常值完全沒有生物學意義。 5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 11283.基于時間序列分析的數(shù)據(jù)流異常值檢測方法研究
- 基于混合線性模型和條件變量分析的DNA微陣列數(shù)據(jù)分析方法研究.pdf
- 基于異常數(shù)據(jù)分析的入侵檢測研究.pdf
- 基于混合模型的多模態(tài)間歇過程測量數(shù)據(jù)異常檢測方法.pdf
- 風電機組運行數(shù)據(jù)中異常值的檢測方法.pdf
- 面板數(shù)據(jù)模型的異常值檢驗.pdf
- 基于大數(shù)據(jù)分析的輸變電設備異常檢測.pdf
- 多維函數(shù)型數(shù)據(jù)中基于投影的異常值檢測.pdf
- 什么是數(shù)據(jù)分析里面的異常檢測
- 觀測數(shù)據(jù)的異常值統(tǒng)計檢驗方法研究.pdf
- 基于對稱性檢測的數(shù)據(jù)分析方法研究.pdf
- 全球能源替代問題研究——基于線性與非線性方法的面板數(shù)據(jù)分析.pdf
- 基于數(shù)據(jù)引力的分類方法及網(wǎng)絡異常檢測模型的研究.pdf
- 傳遞函數(shù)模型中的異常值分析.pdf
- 混合屬性數(shù)據(jù)集異常檢測新方法.pdf
- 兩類時間序列模型的異常值檢測研究.pdf
- 混合空間自回歸模型中多個異常值問題的診斷研究.pdf
- 基于異常值處理的隨機森林和kNN模型在EEG數(shù)據(jù)中的應用.pdf
- 基于時段基因的高維混合面板數(shù)據(jù)分析模型研究.pdf
- 混合屬性數(shù)據(jù)集異常檢測新方法
評論
0/150
提交評論