癌癥基因組遺傳和表觀遺傳數據整合分析.pdf_第1頁
已閱讀1頁,還剩125頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、腦膠質瘤是由一系列遺傳變異和環(huán)境干擾的復雜交互作用引起的。過去的研究很少關注遺傳變異、基因表達和microRNA的變化是怎樣整合形成網絡一起作用并最終導致一系列復雜表型例如腦瘤的發(fā)生。我們以美國癌癥基因組圖譜項目旗艦計劃產生的腦膠質瘤數據為基礎展開研究,使用了包括601個基因在179對樣本中突變數據信息;12042個基因在243個腦膠質瘤腫瘤組織、10個癌旁正常組織和1個細胞系中的表達數據;470個microRNA(miRNA)在240

2、個腫瘤組織和10個癌旁正常組織的表達數據來進行分析。結果發(fā)現了與腦瘤相關的14個體細胞突變,其中8個是新發(fā)現的。同時發(fā)現了11個與腦瘤相關的LOH突變基因。其中9個突變基因與GBM的關系是首次報道。通過基因共表達網絡分析,我們發(fā)現了15個對網絡功能非常重要的基因,其中大部分是癌癥相關的基因。我們也構建了microRNA共表達網絡,發(fā)現了19個重要的microRNA,其中3個microRNA與腦瘤病人的生存期有關。我們將基于序列的預測方法

3、與表達負相關的方法相結合,發(fā)現了3953個預測的miRNA-靶標基因對,14個已被文獻發(fā)表的實驗驗證。使用通路富集分析我們發(fā)現19個重要miRNA靶向調控的那些基因主要參與癌癥相關的信號通路、視感知器傳遞和神經系統相關的過程。我們進行了表達數量性狀(eQTL)分析,連接突變、表達和腦瘤表型相關的通路。對于體細胞突變,我們發(fā)現了4個基因順式數量性狀區(qū)間(cis-eQTL):TP53EGFR,NF1和PIK3C2G;262個基因反式數量性狀

4、區(qū)間(Irans-eQTL)以及26miRNA反式數量性狀區(qū)間。對于LOH突變,我們發(fā)現2個基因順式數量性狀區(qū)間:NRAP和EGFR;409個基因反式數量性狀區(qū)間以及27個miRNA反式數量性狀區(qū)間。我們的結果表明多維數據的整合分析能夠幫助我們揭開腫瘤發(fā)生和進展的機制。
  拷貝數變化是基因組上一段區(qū)域長度約為1KB~3MB的重復或者缺失,被認為是癌癥發(fā)生的重要風險因子。我們采用了癌癥基因組圖譜項目Affymetrix Genom

5、e-Wide Human SNP Array 6.0芯片產生的221個腫瘤樣本,28個癌旁正常組織樣本數據來進行分析。我們使用改進的隱馬爾科夫模型從芯片的906600個CNV標記檢測出163024 CNV區(qū)間。關聯檢驗發(fā)現有104個CNV區(qū)間在腦膠質瘤病例對照組中差異明顯(Bonferroni矯正P值<3.70E-7)。我們以基因和通路為單位對CNV區(qū)間進行了分組關聯檢驗。檢測出169個和腦膠質瘤顯著相關的基因(P值<4.77E-6),

6、其中包括原癌基因BCAS1,抑癌基因CAMTAl,APC和CSMD1,轉錄因子ELF2,和轉錄激活基因ETVl,CREB5和ZHX3。我們進而找出了15個腦瘤顯著相關的通路(FDR<0.05)。這些通路包括:細胞色素P450介導的異源物質代謝通路,鈣離子信號通路,軸突導向通路,大腸癌通路,緊密連接(Tight junction)通路,elF2調控通路,雙鏈RNA誘導的基因表達通路,腦膠質瘤通路,聚糖結構合成,Jak-STAT信號通路,細

7、胞色素P450藥物代謝通路,角質形成細胞分化通路,端粒酶RNA元件基因(hTerc)轉錄調控,經Akt/mTOR調節(jié)的骨骼肌肥大通路,BCR信號通路。同時我們進行了CNV與基因表達和miRNA表達之間的數量性狀區(qū)間分析,結果發(fā)現這169個基因里的拷貝數變化顯著影響到19microRNAs和410個基因的表達。其中3個差異表達的microRNA和90個差異表達的基因被18個包含拷貝數的基因調控。這些結果為發(fā)現腦膠質瘤的發(fā)病機制及其藥物靶標

8、提供了重要線索。
  基因表達受到突變、SNPs、CNVs等遺傳學因素和miRNA、甲基化、組蛋白修飾等表觀遺傳學變化的調節(jié)。理解遺傳和表觀遺傳學變異對基因表達調控的一個重要問題是估計SNPs、CNVs、甲基化和miRNA變化對基因表達貢獻的比例。之前比較流行的估計各種因素對表達貢獻的方法主要是通過單變量回歸來實現的,但存在單個變量遺傳效應很小,但聯合起來對表性差異貢獻很大的情況,而且單變量分析也忽視了不同變量之間的相互作用。本文

9、將擴展使用所有SNPs來解釋對數量性狀貢獻的方法,估計所有基因組學和表觀組學變異對于基因表達的貢獻??捎玫倪z傳和表觀遺傳學信息包括上百萬的SNPs的基因型、上百萬的CNVs標記的拷貝數、幾萬個甲基化位點變化值和幾百個miRNA的表達量。超高維的變量對數據分析產生了巨大的挑戰(zhàn),本文采用稀疏流形學習的局部線性嵌入算法對高維變量進行降維,然后用降維后的數據作為輸入變量進行LASSO回歸分析來估計因素對基因表達的貢獻。我們將本方法用于TCGA項

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論