版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、背景和目的
近年來,大規(guī)模的生物分子相互作用數(shù)據(jù),特別是利用高通量手段研究并整理的蛋白質(zhì)相互作用(Protein-protein interaction,PPI)數(shù)據(jù)庫和海量數(shù)據(jù)的發(fā)布,對于疾病,特別是腫瘤的研究著眼于在病理狀態(tài)下整個分子系統(tǒng)網(wǎng)絡(luò)的動態(tài)變化;同時,開始從系統(tǒng)、全局的角度出發(fā),研究疾病臨床綜合癥群和內(nèi)在的生物分子網(wǎng)絡(luò)之間的關(guān)系,進一步改進疾病的分類標(biāo)準(zhǔn),重新對疾病進行更準(zhǔn)確的定義。
腫瘤蛋白分子
2、標(biāo)記(Protein Biomarker)的應(yīng)用對腫瘤的診斷、預(yù)后和靶向治療有重要的作用;也為疾病的分類提供了有效依據(jù)。然而,由于腫瘤發(fā)生和發(fā)展過程中復(fù)雜病理機制,腫瘤Biomarker發(fā)掘的過程非常艱巨;到目前為止,只有9個腫瘤相關(guān)蛋白通過FDA認(rèn)證,作為臨床檢測Biomarker用于癌癥的診斷檢測。在系統(tǒng)生物學(xué)蓬勃發(fā)展的背景下,作為候選的Biomarker應(yīng)該從系統(tǒng)水平上進行研究,需要大規(guī)模收集數(shù)據(jù),探討腫瘤發(fā)生過程中關(guān)鍵的致病基因
3、和其下游的效應(yīng)基因,選擇有效的診斷和治療Biomarker,盡量避免Biomarker選擇中高假陽性和假陰性等一系列問題。
本課題,我們從系統(tǒng)生物學(xué)角度,探討了腫瘤蛋白Biomarker發(fā)掘的一系列問題。1)首次,從人類分子相互作用網(wǎng)絡(luò)、基因組、蛋白質(zhì)組學(xué),以及癌癥的疾病臨床綜合癥群的宏觀角度,分析1000多個經(jīng)驗型腫瘤蛋白Biomarker的性質(zhì),為腫瘤蛋白Biomarker發(fā)掘計算模型的構(gòu)建,提供了生物學(xué)依據(jù);2)探討
4、腫瘤蛋白Biomarker發(fā)掘的算法,利用人類全局PPI網(wǎng)絡(luò)的信息和疾病表型關(guān)聯(lián)網(wǎng)絡(luò)的信息,進行模型構(gòu)建,較傳統(tǒng)的有效的計算方法,效率進一步提高;3)以原發(fā)性肝細(xì)胞癌(HCC)和其重要的蛋白Biomarker-甲胎蛋白(AFP)為例,深入探討AFP在HCC發(fā)生和發(fā)展中的關(guān)系,比較AFP陽性、陰性HCC臨床樣本中基因表達差異并推斷了相關(guān)的分子機制;4)設(shè)計和研發(fā)面向多級(Muti-scale)生物網(wǎng)絡(luò)的可視化數(shù)據(jù)發(fā)掘工具--ProteoL
5、ens,通過兼容SQL語句,改進了傳統(tǒng)可視化工具的兼容性差,不能方便、有效的處理多樣的系統(tǒng)生物學(xué)數(shù)據(jù)的弱點;能夠更加有效的建立包含豐富注解信息的和多級生物學(xué)網(wǎng)絡(luò),來理解復(fù)雜的生物學(xué)網(wǎng)絡(luò)的結(jié)構(gòu),從中挖掘有效的信息。我們的研究,旨在溝通生物學(xué)基礎(chǔ)研究和臨床醫(yī)學(xué)研究;并構(gòu)架計算分析的平臺,使計算生物學(xué)家也能夠有效的參與腫瘤的診斷和治療這一重大問題中來。主要研究方法
1、數(shù)據(jù)的收集和整理
1)疾病基因,癌癥基因,腫瘤
6、蛋白Biomarker,必要基因,藥物靶分子基因;
2)PPI網(wǎng)絡(luò),TF-基因調(diào)節(jié)網(wǎng)絡(luò),Pathway,基因共表達網(wǎng)絡(luò);
3)組織特異性數(shù)據(jù),組織表達數(shù)據(jù),Gene Ontology數(shù)據(jù),健康人血漿蛋白肽的圖譜數(shù)據(jù);
4)分子ID映射,疾病術(shù)語,分子注解信息;
2、腫瘤蛋白Biomarker的性質(zhì)分析
1)PPI網(wǎng)絡(luò)中拓?fù)湫再|(zhì)比較;
2)組織特異性比較;
7、
3)表達范圍比較;
4)Gene Ontology關(guān)鍵詞比較;
5)Co-Pathway統(tǒng)計;
6)共表達統(tǒng)計;
3、癌癥表型特異性分子網(wǎng)絡(luò)的構(gòu)建
1)PPI網(wǎng)絡(luò)子網(wǎng);
2)TF-基因調(diào)節(jié)子網(wǎng);
4、腫瘤表型關(guān)聯(lián)網(wǎng)絡(luò)的定義與比較
1)腫瘤疾病基因定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
2)腫瘤蛋白Biomark
8、er定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
3)GWAS疾病相關(guān)位點定義的疾病表型關(guān)聯(lián)網(wǎng)絡(luò);
4)網(wǎng)絡(luò)間通過構(gòu)建相似性得分和鄰接矩陣聚類進行比較;
5、SW-RWR算法設(shè)計和評估
1)覆蓋率:
2)敏感性;
3)準(zhǔn)確度;
6、AFP分子演化的分析
1)進化樹構(gòu)建;
2)結(jié)構(gòu)域分析;
3)基因調(diào)節(jié)區(qū)序列分析;
9、> 7、AFP+/-原發(fā)性肝細(xì)胞癌臨床樣本的基因表達差異分析
1)肝細(xì)胞癌表達譜數(shù)據(jù)收集與整理;
2)Meta-analysis;
3)貝葉斯網(wǎng)絡(luò)和PPI網(wǎng)絡(luò)比較;
4)基因功能分析;
8、網(wǎng)絡(luò)可視化軟件ProteoLens的設(shè)計和實現(xiàn)
1)基礎(chǔ)框架;
2)Java編程實現(xiàn);
3)系統(tǒng)生物學(xué)研究示例。
研究
10、結(jié)果
第一部分
腫瘤蛋白Biomarker的性質(zhì)分析
為評估腫瘤蛋白Biomarker的特性,我們選擇疾病基因、癌癥基因、藥物靶蛋白和必要基因作為參照。
1)各個功能集合之間的重疊的基因數(shù)目較少;
2)腫瘤Biomarker在PPI網(wǎng)絡(luò)中的節(jié)點的平均度數(shù)小于癌癥基因和必要基因在PPI網(wǎng)絡(luò)中節(jié)點的平均度數(shù),但高于疾病基因和藥物靶蛋白的平均數(shù);
3)腫瘤蛋白
11、Biomarker包含較多的組織特異性基因;
4)腫瘤蛋白Biomarker中基因平均表達的組織數(shù)目甚至多于必要基因集合中的平均水平;
5)腫瘤蛋白Biomarker集中共有385個顯著的GO術(shù)語,包括26個細(xì)胞模塊術(shù)語,0個分子功能術(shù)語和359個生物過程術(shù)語;
6)腫瘤蛋白Biomarker在以疾病基因為種子擴張的PPI和PPI-TF-調(diào)節(jié)基因網(wǎng)絡(luò)中的分布:當(dāng)選擇更加精確的的種子蛋白(接近癌癥
12、基因的時候)進行PPI和PPI-TF-調(diào)節(jié)基因網(wǎng)絡(luò)構(gòu)建,與腫瘤蛋白Biomarker的交集占總腫瘤蛋白Biomarker集的比率顯著增大;
7)腫瘤蛋白Biomarker和相應(yīng)表型的疾病基因易于共表達并參與同一Pathway。
構(gòu)建基于腫瘤蛋白Biomarker疾病表型網(wǎng)絡(luò)(DBN)
762個腫瘤蛋白Biomarker對應(yīng)于59類不同的癌癥表型中,包含820個“Biomarker-疾病表型”關(guān)聯(lián)
13、,平均兩個癌癥表型有8個相同的Biomarer;每個Biomarker出現(xiàn)在13個癌癥表型中。所有59個結(jié)點,連接成一個聯(lián)通圖,沒有孤立結(jié)點或子網(wǎng)。
比較DBN和基于疾病基因的疾病表型網(wǎng)絡(luò)(DAN)
疾病基因和蛋白Biomarker描述的腫瘤表型之間關(guān)系具有等效性。
第二部分
SW-RWR算法
是在隨機行走算法(Random Walks Ranking,RWR)的基礎(chǔ)
14、上,利用腫瘤表型關(guān)聯(lián)網(wǎng)絡(luò)的先驗知識,指導(dǎo)PPI網(wǎng)絡(luò)中隨機行走策略。SW-RWR是為解決腫瘤蛋白Biomarker發(fā)掘的問題對RWR算法的改進。
SW-RWR算法對白血病蛋白Biomarker的排序
1)從基于腫瘤Biomarker的表型關(guān)聯(lián)網(wǎng)絡(luò)中,依據(jù)相似性得分提取白血病相關(guān)的疾病表型;
2)分析白血病與選擇的表型之間的相關(guān)性:與白血病相關(guān)聯(lián)的這5個癌癥表型,其疾病基因與白血病疾病基因之間通過蛋
15、白質(zhì)相互作用緊密關(guān)聯(lián);
3)SW-RWR選擇的20個蛋白的生物學(xué)意義分析,顯示出與白血病分子機制的強相關(guān)性;
4)通過敏感性和準(zhǔn)確率(使用陽性預(yù)測值,PPV)評估對白血病蛋白Biomarker的預(yù)測效力:SW-RWR優(yōu)于ZRWR。
SW-RWR算法對肺癌蛋白Biomarker的排序
1)建立基于GWAS的疾病表型關(guān)聯(lián)網(wǎng)絡(luò):分別創(chuàng)建了3個疾病相關(guān)網(wǎng)絡(luò)(DAN),網(wǎng)絡(luò)結(jié)點為疾病表型,網(wǎng)
16、絡(luò)關(guān)聯(lián)分別定義為:疾病表型之間有相同的SNP位點(DAS)-DAN1,相同的DAS對應(yīng)基因-DAN2,或相同的DAs對應(yīng)的染色體區(qū)域-DAN3。共包含85個不同的節(jié)點,代表85個獨立疾病表型。
2)DAN中抽取與肺癌關(guān)聯(lián)的子網(wǎng):確定5個肺癌相關(guān)的疾病表型,這5個疾病和肺癌在遺傳學(xué)上有相同的異?;?;這些疾病基因之間通過直接或間接地PPI相互連接,表示了疾病之間的分子機制的內(nèi)在關(guān)聯(lián);同時,在病理研究上,這5個疾病也有與肺癌關(guān)
17、聯(lián)緊密的證據(jù)。
3)SW-RWR選擇的20個蛋白的生物學(xué)意義分析;
4)通過敏感性和準(zhǔn)確率評估對肺癌蛋白Biomarker的預(yù)測效力:SW-RWR優(yōu)于RWR。
第三部分
AFP以及類自蛋白家族分子演化分析
1)進化樹顯示,蛋白的進化與物種的進化是一致的,就AFP分支來看,雞較人、狗、大鼠、小鼠同源性較低,而更相似于其旁系同源物--雞ALB;大鼠與小鼠之間AFP同源性較
18、高,人與狗之間AFP同源性較高。類白蛋白家族成員,在魚類只存在一個,兩棲類有兩個,鳥類有三個,哺乳類有四個。
2)結(jié)構(gòu)域分析。在七鰓鰻中發(fā)現(xiàn)了具有多個結(jié)構(gòu)域的白蛋白,由此可以推測,在原索動物或無脊椎動物中存在單個的類似白蛋白結(jié)構(gòu)域的蛋白。來自于同一個蛋白的不同白蛋白結(jié)構(gòu)域之間較與其直系同源蛋白對應(yīng)的白蛋白結(jié)構(gòu)域差別較大,可以推測,基因復(fù)制事件是以蛋白為單位的。類白蛋白家族成員,第一和第二結(jié)構(gòu)域較第三結(jié)構(gòu)域更為相似,可推斷最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 復(fù)雜生物網(wǎng)絡(luò)可視化方法研究.pdf
- MyBioNet-在線生物網(wǎng)絡(luò)可視化、編輯和整合的Web應(yīng)用.pdf
- 代謝網(wǎng)絡(luò)的可視化軟件開發(fā).pdf
- 54065.可視化生物統(tǒng)計軟件的研究與開發(fā)
- 可視化網(wǎng)絡(luò)拓?fù)渌惴败浖_發(fā).pdf
- 可視化供電能力計算軟件的開發(fā)及應(yīng)用.pdf
- 網(wǎng)絡(luò)環(huán)境下生物計算建模三維可視化的研究.pdf
- 供熱系統(tǒng)可視化仿真軟件的開發(fā).pdf
- 電力系統(tǒng)可視化潮流計算軟件的研究與開發(fā).pdf
- CFB鍋爐可視化熱力計算軟件開發(fā).pdf
- 可視化配電網(wǎng)計算軟件平臺的研究與開發(fā).pdf
- 礦井通風(fēng)網(wǎng)絡(luò)可視化軟件的研制與實現(xiàn)——通風(fēng)網(wǎng)絡(luò)可視化研究.pdf
- 腫瘤的生物學(xué)特性
- 軟件協(xié)同開發(fā)的手機可視化監(jiān)控及可視方法評估.pdf
- 基于Memetic計算的生物網(wǎng)絡(luò)全局比對研究.pdf
- 配電網(wǎng)可視化潮流計算軟件的研究與開發(fā).pdf
- 基于智能計算的生物網(wǎng)絡(luò)構(gòu)建算法的研究.pdf
- 井眼軌跡計算及可視化系統(tǒng)研究與開發(fā).pdf
- 蛋白網(wǎng)絡(luò)聚類研究及其可視化軟件開發(fā).pdf
- 熱力系統(tǒng)可視化仿真軟件模型開發(fā).pdf
評論
0/150
提交評論