版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、大多數(shù)癌癥芯片數(shù)據(jù)研究關(guān)注的是識別特異組織癌細(xì)胞的分子特性。最近,科研工作者開始利用基因芯片數(shù)據(jù),研究特異組織癌細(xì)胞的預(yù)后特性,但關(guān)于普遍的腫瘤預(yù)后的分子生物學(xué)機(jī)制仍待研究。本文在現(xiàn)有研究成果之上,使用元分析(meta-analysis)手段研究多種腫瘤數(shù)據(jù)源的信號共發(fā)生的幾率。 本文首先通過研究特異組織腫瘤亞型間的共同表達(dá)調(diào)控信號,研究多源數(shù)據(jù)元分析方法。論文修正現(xiàn)有的元分析方法:基于不同數(shù)據(jù)源的有序基因列表秩打分(RS)算法
2、。利用實(shí)際表達(dá)芯片數(shù)據(jù),發(fā)現(xiàn)RS與“一對多”(0VA)或“一對一”(OVO)比對結(jié)合,是分析多源數(shù)據(jù)的有效方法。論文還通過有效聚類說明,6個(gè)獨(dú)立實(shí)驗(yàn)的白血病亞型問的信號差異強(qiáng)于芯片系統(tǒng)間差異信號。 論文探討了跨臨床表征的癌癥共同分子機(jī)制的存在性,并研究發(fā)現(xiàn)這一共性的方法。我們創(chuàng)造性地設(shè)立了模式匹配(Meta-Analysis Pattern Matches)元分析概念。在分析了白血病、惡性間皮瘤和兩個(gè)獨(dú)立乳腺癌共四個(gè)基因芯片數(shù)據(jù)
3、后,發(fā)現(xiàn) 42 個(gè)基因在不同癌癥病人的治療結(jié)果分組比對中都顯示了一致的差異表達(dá)。這些基因不但證實(shí)了跨臨床表征的癌癥共同分子機(jī)制的存在性,而且是已公布的候選通用預(yù)后標(biāo)志(universal prognostic markers)基因的補(bǔ)充。 為了定量地測定與治療結(jié)果相關(guān)的不同表型癌癥間的共同分子機(jī)制,論文進(jìn)一步研究并提出了新的更成熟的統(tǒng)計(jì)算法——排序的基因列表的相似性打分算法(Similarities of Ordered Gen
4、e List-SOGL)。SOGL算法的核心思想是不依賴于某個(gè)單一數(shù)據(jù)集中顯著的差異表達(dá)的效應(yīng)量,而是關(guān)注多實(shí)驗(yàn)中一致的差異表達(dá)的效應(yīng)量。該算法基于有序基因列表的排序,賦予越位于排序列表兩端的基因越高的權(quán)重,累加權(quán)重的打分揭示了有序基因列表問的相似性。與其它元分析算法比較,它尤其敏感于差異表達(dá)排序相似但有序基因列表本身的差異表達(dá)不明顯的情況。在分析了五個(gè)獨(dú)立的臨床數(shù)據(jù)源后(惡性間皮瘤、神經(jīng)膠質(zhì)瘤、前列腺癌和兩個(gè)獨(dú)立乳腺癌),我們從10對
5、可能的成雙比對中檢測到5對顯著相似的有序基因列表。為了說明算法的敏感性,以上5個(gè)被分析的數(shù)據(jù)集中包括無顯著表達(dá)基因的數(shù)據(jù)集。 研究目標(biāo)是從大規(guī)模芯片數(shù)據(jù)中統(tǒng)計(jì)保守的癌癥預(yù)后標(biāo)志基因。不包含顯著差異達(dá)基因的數(shù)據(jù)集產(chǎn)生的有序基因列表間的相似結(jié)果往往令人質(zhì)疑:這樣找到的標(biāo)志基因是否能提高預(yù)后效果?因此,在SOGL,的基礎(chǔ)上,論文將現(xiàn)有的兩兩比對算法擴(kuò)展為多序列比對。我們發(fā)現(xiàn)前列腺癌存活、惡性間皮瘤復(fù)發(fā)和神經(jīng)膠質(zhì)瘤存活所對應(yīng)的3條有序基
6、因列表之間顯著相似。隨后,我們選用排序列表相似性打分為支持向量機(jī)(SVM)算法的變量提取算法,發(fā)現(xiàn)導(dǎo)致3條有序基因列表相似的13個(gè)標(biāo)志基因能夠提高原始數(shù)據(jù)集的預(yù)后判別準(zhǔn)確率。有臨床意義的是,這組標(biāo)志基因中的12個(gè)基因與血管增生調(diào)控(regulation ofangiogeesis)有關(guān),并且能夠準(zhǔn)確地預(yù)測成人T細(xì)胞白血病人的治療后效果。13個(gè)標(biāo)志基因中的12個(gè)涉及血管增生及其調(diào)控和組裝的基因是MDK、CPE、POSTN、COL4A1、C
7、OLllA1、COLlA2、COL5A2、IGFBP3、FN1、ANXA2、BGN和PTGDS。該結(jié)果提示細(xì)胞外的基質(zhì)蛋白的破壞是血管新生相關(guān)的癌癥入侵和轉(zhuǎn)移的重要因素。 最后,我們開發(fā)了SOGL算法的軟件包-OrderedList。該軟件包與流行的生物信息學(xué)世界共享軟件工具集R/Bioconductor兼容。它是一個(gè)元分析基因表達(dá)芯片數(shù)據(jù)的工具,主要用于從包括微妙變化的多個(gè)數(shù)據(jù)集中識別穩(wěn)定可重復(fù)的信號。除了統(tǒng)計(jì)度量外,該軟件包
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基因芯片整合分析方法在癌癥基因表達(dá)譜分析中的應(yīng)用.pdf
- 基于基因芯片的基因表達(dá)模式分析.pdf
- 43073.基因芯片數(shù)據(jù)的預(yù)處理方法對基因表達(dá)譜后續(xù)分析的影響
- K562細(xì)胞基因表達(dá)譜及基因芯片制備研究.pdf
- 應(yīng)用基因芯片技術(shù)對SLE患者外周血基因表達(dá)譜的研究.pdf
- 基因芯片研究肝硬化和原發(fā)性肝癌的基因表達(dá)譜.pdf
- 應(yīng)用基因芯片研究針刺涌泉延緩衰老的差異表達(dá)基因譜.pdf
- 基于Affymetrix基因芯片的基因表達(dá)水平計(jì)算研究.pdf
- 利用基因芯片分析小麥春化過程中莖尖基因表達(dá)譜的研究.pdf
- 基于基因芯片技術(shù)的轉(zhuǎn)錄組表達(dá)研究.pdf
- 基于基因表達(dá)譜數(shù)據(jù)的癌癥分類研究.pdf
- 基于基因表達(dá)譜的癌癥分類問題研究.pdf
- 用基因芯片研究熱藥治療寒證的差異基因表達(dá)譜.pdf
- 腫瘤表達(dá)譜基因芯片篩選膽囊癌腫瘤相關(guān)基因的研究.pdf
- 基因芯片技術(shù)在成年男性精子基因表達(dá)譜研究中的應(yīng)用.pdf
- 基因芯片分析
- 面向疾病的基因芯片差異分析方法研究.pdf
- 41951.基因芯片數(shù)據(jù)和基因表達(dá)分析
- 基因芯片數(shù)據(jù)分析方法的比較研究.pdf
- 胃癌基因芯片的差異表達(dá)基因研究.pdf
評論
0/150
提交評論