基于得分檢驗的整體基因間共關聯(lián)作用統(tǒng)計方法研究.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、全基因組關聯(lián)研究(genome wide association study,GWAS)試圖尋找與疾病狀態(tài)相關的遺傳位點,這對人類理解復雜疾病的遺傳機制發(fā)揮著重要作用,同時也為成功實現(xiàn)復雜疾病的預防和診治提供了嶄新的技術方法。然而,總結GWAS的分析結果,卻發(fā)現(xiàn)其與預期成果相差甚遠,借助GWAS發(fā)現(xiàn)的遺傳變異,較難解釋大部分復雜疾病的遺傳特征,這就引發(fā)了遺傳度的缺失問題。導致該問題產生的原因有很多:如基因-基因聯(lián)合效應的存在、罕見變異的

2、影響、對已鑒定出與疾病相關等位基因效應的低估、表觀遺傳因素可能會導致親人間比較相似,以及對所要研究疾病遺傳度的過高估計等。其中,基因-基因交互作用的存在是對遺傳度缺失的一個合理解釋,其在疾病的認識和發(fā)展中占有重要作用。如果忽略了基因之間的交互作用,將無法真實準確地描述遺傳變異的效應。
  流行病學中基因-基因交互作用可以理解為,在兩基因變異獨立作用于某疾?。ɑ虮硇停┑那疤嵯?,其對該疾?。ɑ虮硇停┑穆?lián)合作用。統(tǒng)計學中常用logist

3、ic回歸模型中的乘積項來表示傳統(tǒng)意義上的相乘交互作用。此模型暗含了基因A和B間要符合近乎獨立性假設。事實上,在復雜基因網絡系統(tǒng)中,基因之間往往是通過特定通路結點之間的相關聯(lián)而發(fā)揮網絡調控作用,而并非相互獨立地對疾病產生作用。在此基礎上,本課題組提出了一種新概念—基因-基因共關聯(lián),其可以定義為與該病相關的兩基因之間的聯(lián)合效應,即為兩基因獨立情況下的交互作用和兩基因不獨立情況下的關聯(lián)作用之和。通常,位于與某種疾病相關的同一條特定通路或同一個

4、網絡中的基因是協(xié)同工作的,并且與疾病相關的交互位點之間高度相關。在此背景下,基因-基因共關聯(lián)要比基因-基因交互作用更加適用于處理遺傳度的缺失問題。另外,檢驗基因-基因共關聯(lián)作用可以在某種程度上為學習和構建遺傳網絡提供幫助。因此,發(fā)展能夠有效檢驗基因-基因共關聯(lián)的統(tǒng)計方法是一項十分重要而迫切的任務。
  為了檢驗兩整體基因之間的共關聯(lián)作用,本課題組已經發(fā)展了多種統(tǒng)計方法,如基于單核苷酸多態(tài)性(single nucleotide po

5、lymorphisms,SNPs)水平的Fisher r toz轉換統(tǒng)計量、基于典型相關理論構建的統(tǒng)計量(statistic based on canonicalcorrelations,CCU)、基于核典型相關理論構建的統(tǒng)計量(statistic based on kernelcanonical correlation analysis,KCCU)及基于偏最小二乘路徑模型構建的統(tǒng)計量(partial least squares pat

6、h modeling,PLSPM)。然而現(xiàn)有的方法尚不能有效檢驗兩整體基因間的共關聯(lián)作用,各種方法在計算速度和檢驗效能上都具有一定程度的局限性。故發(fā)展有效基于整體基因檢驗基因-基因共關聯(lián)作用的統(tǒng)計方法具有十分重要的意義。
  目的:
  本研究將基于經典得分檢驗理論構建一種新型統(tǒng)計量(score-based statistic,SBS),用于檢驗整體基因之間的共關聯(lián)作用。
  方法:
  該統(tǒng)計量是想通過捕獲兩致

7、病基因間的協(xié)方差效應,對基因-基因共關聯(lián)作用進行檢驗。一系列理論推導、統(tǒng)計模擬和實際數(shù)據(jù)分析將被用來評價該統(tǒng)計方法的穩(wěn)定性和有效性。為了更加全面地評價該方法的具體表現(xiàn),在統(tǒng)計模擬和實際數(shù)據(jù)分析的過程中,幾種常用方法同時被用來比較,如基于單個SNP的logistic回歸模型、基于主成分分析的logistic回歸模型、基于協(xié)方差的δ2統(tǒng)計量、CCU統(tǒng)計量、KCCU統(tǒng)計量、PLSPM統(tǒng)計量及LASSO等。
  結果和結論:
  1

8、、本文總結了各種檢驗基因間共關聯(lián)作用的統(tǒng)計方法,指出了從整體基因層面分析基因-基因共關聯(lián)作用的必要性,而不是簡單分析單一SNP對間的共關聯(lián)作用。
  2、本文以傳統(tǒng)的得分檢驗思想為基礎,提出基于整體基因的用于檢驗基因-基因共關聯(lián)的SBS統(tǒng)計量。1)與多種現(xiàn)有非參數(shù)檢驗基因-基因共關聯(lián)作用的統(tǒng)計方法相比,該方法在原假設成立的前提下,嚴格服從卡方分布,所以在具體的假設檢驗過程中,避免使用自助抽樣或置換檢驗技術,計算速度大大提高,更適合

9、用來檢驗兩基因間的共關聯(lián)作用。2)與基于單個SNP的檢驗方法相比,本研究提出的SBS統(tǒng)計量以整體基因為基礎,能夠抓住各基因內部的連鎖不平衡(linkage disequilibrium,LD)結構,綜合利用多個SNP位點間的信息,這既符合遺傳學原理,又便于理解基因功能,檢驗基因間的共關聯(lián)更有效率,同時也可以避免多個SNP間的多重共線性問題。3)和其他幾種方法相比,SBS統(tǒng)計量既能利用基因內部的線性信息,又能利用基因內部的非線性結構,具有

10、較高的檢驗效能。
  3、統(tǒng)計模擬和實際數(shù)據(jù)分析表明:1)本文提出的SBS統(tǒng)計量在不同樣本量、不同主效應組合及不同相關結構下,一類錯誤均穩(wěn)定在給定的檢驗水準附近,說明該統(tǒng)計量具有良好的穩(wěn)定性。2)在原假設不成立的條件下,隨著交互效應及樣本量的增加,檢驗效能逐漸增大;隨著兩基因間相關結構的變化,SBS統(tǒng)計量的檢驗效能也不斷變化,且和其他方法相比,始終處于相對較高的水平。3)在關于風濕性關節(jié)炎和冠心病的實際數(shù)據(jù)分析中,SBS統(tǒng)計量能夠

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論