腫瘤相關(guān)分子網(wǎng)絡的生物信息學挖掘.pdf_第1頁
已閱讀1頁,還剩262頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、現(xiàn)代腫瘤學的研究的一大進展是發(fā)現(xiàn)了大量的癌基因和抑癌基因。但僅僅靠癌基因和抑癌基因并不能解釋所有的腫瘤現(xiàn)象,也不能有效解決腫瘤的臨床問題。實際上腫瘤是一大類疾病。每個個體腫瘤都蘊含著復雜的分子相互作用關(guān)系,比如基因之間的、mRNA和非編碼RNA之間的、蛋白質(zhì)和基因及RNA之間的,等等。這些復雜關(guān)系一起決定了腫瘤的復雜性和難治性。因此有必要在整體上把握腫瘤的內(nèi)在分子機制(比如與腫瘤相關(guān)的蛋白質(zhì)通過互作連接成的網(wǎng)絡)。而當前的生物醫(yī)學技術(shù)的

2、快速進展,特別是新一代測序技術(shù)的不斷進步,使得不同疾病不同條件下的全基因組廣度的基因、RNA、蛋白質(zhì)等的表達譜得到近乎完整捕獲,科學家有了從整體上來把握生理或病理的內(nèi)在分子機制。但大量的高維度數(shù)據(jù)的產(chǎn)生,使得分析這些巨量數(shù)據(jù)成了一大挑戰(zhàn)。在生物醫(yī)學家和數(shù)學工程人員的共同協(xié)作努力下,一大批用于處理不同特征的大數(shù)據(jù)的生物信息學分析工具得以出現(xiàn)。通過應用這些工具,科學家從生物大數(shù)據(jù)中挖掘出了以前低通量研究方法捕捉不到的生理或病理的內(nèi)在分子活動

3、特征。
  本文首先從整體的角度采用三種不同的方法去獲得與腫瘤相關(guān)的分子集。首先是用文獻挖掘軟件GENCLIP從PUBMED公共文獻數(shù)據(jù)庫挖掘出文獻報道的腫瘤相關(guān)基因;其次用GEO2R軟件從基因芯片表達譜數(shù)據(jù)庫挖掘出腫瘤樣本中差異表達的基因;然后從RNAi干擾數(shù)據(jù)庫篩選出對腫瘤細胞行為有明顯干擾效果的基因。接著對這三種方法獲得的基因進行相交獲得交集,該交集再并上一個公認的癌基因集COSMIC,這樣的并集本文將之確定為腫瘤相關(guān)基因集

4、(Tumor Association Genes Set,TAGS)。通過上述方法,本文獲取了一個含7337個基因的腫瘤相關(guān)基因集。針對該基因集TAGS,分析了集內(nèi)的分子特征,比如染色體分布、GC含量、5'UTR長度,其中TAGS集的5'UTR的長度長于整個基因組編碼蛋白的基因的5'UTR的長度。本文還將該基因集內(nèi)基因所代表的蛋白質(zhì)構(gòu)成了一個蛋白質(zhì)互作網(wǎng)絡,并分析了該網(wǎng)絡的特征,比如度(degree)、介數(shù)(betweenness)等,

5、確定了該網(wǎng)絡為無尺度網(wǎng)絡。最后用網(wǎng)絡分析軟件Cytoscape鑒定出該網(wǎng)絡中有相對較多鏈接數(shù)目的hub蛋白質(zhì)共698個。這些hub蛋白質(zhì)與非hub蛋白質(zhì)相比,由于有相對多的連接,對它們的攻擊,很可能影響到整個網(wǎng)絡的穩(wěn)定。因此,這些鑒定出的hub蛋白質(zhì)可能成為腫瘤診斷和治療的候選靶點。
  其次,基于將整個網(wǎng)絡劃分為局部的子網(wǎng)絡能更好地認識網(wǎng)絡特性這一事實,本文利用基因本體論(Gene Ontology,簡稱GO)數(shù)據(jù)庫所包含的主要

6、生物學過程(Biological Process)知識,將每個主要的生物學過程作為一個細胞內(nèi)的功能模塊。并用網(wǎng)絡分析軟件Cytoscape分析這些生物學過程收納蛋白質(zhì)所構(gòu)成的網(wǎng)絡是否是無尺度網(wǎng)絡。通過上述方法,本文獲取了細胞的30個主要生物學過程所收納的基因(蛋白質(zhì)),并確定了所有這些模塊內(nèi)的蛋白質(zhì)構(gòu)成的網(wǎng)絡都是無尺度網(wǎng)絡,用Cytoscape的插件獲得了每個功能模塊的hub蛋白質(zhì)。上述30個功能模塊中的細胞分裂、細胞分化、細胞程序性死

7、亡和細胞侵襲遷移等四大模塊由于和細胞表型命運密切相關(guān),本文稱之為四大細胞表型模塊。四大模塊功能執(zhí)行了相關(guān)的細胞的重大表型改變過程,其中每個過程都存在關(guān)鍵的步驟,是細胞表型改變的直接體現(xiàn)。細胞分裂模塊的關(guān)鍵步驟是“染色體分離”和“胞質(zhì)分裂”;細胞程序性死亡模塊的關(guān)鍵步驟是“凋亡的啟動”和“凋亡的執(zhí)行”;細胞分化模塊的關(guān)鍵步驟是細胞分化標志物的出現(xiàn);細胞侵襲遷移模塊的關(guān)鍵步驟是“細胞膜或細胞外基質(zhì)或偽足上的腫瘤轉(zhuǎn)移相關(guān)蛋白質(zhì)的表達。通過文獻

8、檢索四大模塊的關(guān)鍵詞,本文確定了這四大功能模塊中在關(guān)鍵步驟起決定作用的表型執(zhí)行蛋白質(zhì)。
  接著,利用上述確定的功能模塊和表型執(zhí)行蛋白質(zhì),本文分析了誘導人多功能干細胞(induced pluripotent stem cells,iPS)表達譜構(gòu)成網(wǎng)絡,用Cytoscape軟件鑒定了重編程因子之一的MYC激活下游細胞周期模塊、細胞分裂模塊及細胞分裂執(zhí)行蛋白的信號級聯(lián)過程。經(jīng)分析發(fā)現(xiàn),MYC的下游第一、二、三級信號分子基本覆蓋了一半

9、以上的細胞分裂模塊、細胞周期模塊的基因,說明MYC做為轉(zhuǎn)錄因子能迅速激活細胞周期和細胞分裂活動。經(jīng)過該分析,初步探測到MYC在維持干細胞自我更新過程的分子活動。然后本文分析了一個有10例樣本的肝癌的表達譜(另附有10例正常對照),利用K均數(shù)聚類方法從上述10對樣本中鑒定出各功能模塊的典型樣本。繼而分析這些典型樣本的基因差異表達模式:hub蛋白的數(shù)目、上調(diào)表達基因構(gòu)成的信息級聯(lián)長度及表型執(zhí)行蛋白數(shù)目。在此基礎上,初步獲得了判斷每個功能模塊

10、是否激活的標準。利用該標準,進一步分析另一個匯集了從肝癌癌前病變到早期肝癌和晚期肝癌的表達譜集,判斷該疾病動態(tài)進展中部分功能模塊的激活與否,比如通過分析發(fā)現(xiàn)在極早期肝癌細胞侵襲遷移模塊沒有激活但在肝癌晚期和極晚期該模塊激活了。通過對肝癌從癌前到晚期肝癌各階段各功能模塊的激活的判斷,從而觀察到疾病動態(tài)過程中的主要分子網(wǎng)絡變化特征。
  最后,本文在腫瘤相關(guān)基因集TAGS中選定一個hub蛋白:真核翻譯起始因子4e(EIF4E),采用免

11、疫組化方法分析了該hub蛋白在55例肝癌和癌旁肝組織中的表達,同時分析了它的表達和臨床資料關(guān)系。通過上述方法發(fā)現(xiàn)EIF4E在肝癌高表達,在癌旁有限表達,在正常肝組織低表達或無表達;EIF4E表達與腫瘤的分化程度密切相關(guān)。EIF4E可能是一個肝癌的標志物,有可能成為靶向治療的候選靶點。
  總之,本文利用多種生物信息工具挖掘了現(xiàn)有的部分生物醫(yī)學數(shù)據(jù)庫,從中鑒定出了與癌基因特征相似的7337個腫瘤相關(guān)基因。并從中篩選出多個hub蛋白,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論