版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生命是一個(gè)多層次的復(fù)雜系統(tǒng),通過(guò)分子間復(fù)雜的相互作用來(lái)實(shí)現(xiàn)生物學(xué)功能,這一點(diǎn)在細(xì)胞對(duì)基因時(shí)空特異性表達(dá)的控制方面已得到充分體現(xiàn)。本文致力于利用多元統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的方法,從高通量、大樣本的生物實(shí)驗(yàn)數(shù)據(jù)中挖掘基因表達(dá)的調(diào)控關(guān)系并構(gòu)建基因調(diào)控網(wǎng)絡(luò),旨在從生物分子網(wǎng)絡(luò)層次揭示基因表達(dá)調(diào)控系統(tǒng)的運(yùn)行機(jī)制。通過(guò)本研究,我們提出了能夠提高基因表達(dá)調(diào)控關(guān)系預(yù)測(cè)準(zhǔn)確度的計(jì)算方法,并進(jìn)一步揭示了基因表達(dá)調(diào)控系統(tǒng)復(fù)雜性背后蘊(yùn)含的內(nèi)在規(guī)律。本文中的研究方法和結(jié)
2、果為從生物分子網(wǎng)絡(luò)層次理解基因表達(dá)調(diào)控機(jī)制、揭示復(fù)雜疾病發(fā)生發(fā)展的原因提供了重要參考。
基因表達(dá)調(diào)控體系是指遺傳信息從DNA到蛋白質(zhì)流動(dòng)的整個(gè)過(guò)程的調(diào)節(jié)方式和機(jī)制,對(duì)細(xì)胞時(shí)空特異地執(zhí)行生物學(xué)功能起決定作用,是細(xì)胞的核心控制系統(tǒng)。因而,基因表達(dá)調(diào)控系統(tǒng)長(zhǎng)期以來(lái)都是分子生物學(xué)家和生物信息學(xué)家們最為關(guān)注的研究對(duì)象之一。轉(zhuǎn)錄因子對(duì)基因的調(diào)控是早期基因表達(dá)調(diào)控研究的主要內(nèi)容,學(xué)術(shù)界已提出了大量預(yù)測(cè)算法,但由于這些算法往往只是單純地通過(guò)基
3、因組序列信息進(jìn)行預(yù)測(cè),其預(yù)測(cè)結(jié)果的理論研究和實(shí)驗(yàn)指導(dǎo)價(jià)值都比較有限。隨著基因表達(dá)調(diào)控研究的不斷深入,人們發(fā)現(xiàn)除轉(zhuǎn)錄因子之外,真核細(xì)胞還擁有其他多種重要的表達(dá)調(diào)控機(jī)制,如非編碼RNA調(diào)控、染色質(zhì)表觀遺傳修飾調(diào)控等。如何準(zhǔn)確地鑒定各類(lèi)調(diào)控因子與基因之間的調(diào)控關(guān)系,并明確其相應(yīng)的調(diào)控模式和特征,是該領(lǐng)域存在的重要科學(xué)問(wèn)題。進(jìn)入21世紀(jì)以來(lái),轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和表觀基因組學(xué)等高通量實(shí)驗(yàn)技術(shù)快速發(fā)展,為基因表達(dá)調(diào)控研究提供了大量的細(xì)胞內(nèi)分子真實(shí)
4、狀態(tài)信息,同時(shí)也對(duì)生物信息學(xué)家的數(shù)據(jù)分析和挖掘能力提出了挑戰(zhàn)。上述問(wèn)題是基因表達(dá)調(diào)控研究領(lǐng)域亟待解決的重要問(wèn)題,也是本文工作的基本出發(fā)點(diǎn)。
本文從兩個(gè)角度研究真核基因表達(dá)調(diào)控系統(tǒng):基于基因序列結(jié)構(gòu)的轉(zhuǎn)錄調(diào)控和基于分子相互作用的表達(dá)調(diào)控。首先,在基于基因序列結(jié)構(gòu)的轉(zhuǎn)錄調(diào)控研究方面,我們重點(diǎn)關(guān)注一種基于序列的基因轉(zhuǎn)錄調(diào)控結(jié)構(gòu)——雙順?lè)醋踊?。雙順?lè)醋踊蝾?lèi)似于原核細(xì)胞的操縱子(operon),可以在同一個(gè)轉(zhuǎn)錄本上翻譯兩個(gè)不同的蛋白
5、質(zhì),因而這兩個(gè)蛋白質(zhì)共享相同的轉(zhuǎn)錄調(diào)控信號(hào)。這種基因結(jié)構(gòu)在原核生物中較為常見(jiàn),但在真核生物中卻僅有一些個(gè)例被發(fā)現(xiàn)。作為一種有趣的基因調(diào)控組織方式,雙順?lè)醋釉谡婧松锘蚪M中出現(xiàn)頻率尚不清楚,且其結(jié)構(gòu)與功能產(chǎn)物之間的是否存在一定關(guān)系也不得而知。為此,我們基于雙順?lè)醋踊虻慕Y(jié)構(gòu)性特點(diǎn),采用比較基因組學(xué)和機(jī)器學(xué)習(xí)的研究方法,在人類(lèi)全基因組范圍內(nèi)對(duì)雙順?lè)醋踊蜻M(jìn)行了準(zhǔn)確預(yù)測(cè),在人類(lèi)基因組中預(yù)測(cè)到30個(gè)保守的雙順?lè)醋踊?為準(zhǔn)確估計(jì)該類(lèi)基因結(jié)構(gòu)在
6、哺乳動(dòng)物中的出現(xiàn)頻率提供了參考數(shù)據(jù)。在此基礎(chǔ)上,我們根據(jù)蛋白質(zhì)結(jié)構(gòu)域信息構(gòu)建了雙順?lè)醋拥牡鞍踪|(zhì)產(chǎn)物間的相互作用網(wǎng)絡(luò),并通過(guò)平均網(wǎng)絡(luò)距離算法發(fā)現(xiàn)了同一個(gè)雙順?lè)醋踊蛩磉_(dá)的蛋白質(zhì)之間傾向于具有直接的相互作用,因而可能參與相同的通路或執(zhí)行相關(guān)的生物學(xué)功能。這一結(jié)論從基因功能產(chǎn)物水平解釋了雙順?lè)醋踊蛟谡婧松镏斜J卮嬖诘脑颉M管在基因中同時(shí)維持兩個(gè)開(kāi)放閱讀框會(huì)承受更大的進(jìn)化壓力,然而如果能夠使兩個(gè)在功能上相關(guān)或是有相互作用的蛋白質(zhì)感受相
7、同的調(diào)控信號(hào),則雙順?lè)醋拥幕蚪Y(jié)構(gòu)不失為一種高效的基因表達(dá)調(diào)控機(jī)制。
各類(lèi)調(diào)控因子對(duì)基因的表達(dá)調(diào)控是真核細(xì)胞中更普遍的調(diào)控方式,主要通過(guò)與基因的復(fù)雜相互作用最終實(shí)現(xiàn)了細(xì)胞對(duì)基因時(shí)空特異表達(dá)的精確控制。因此,本文進(jìn)一步針對(duì)調(diào)控因子和基因之間的調(diào)控關(guān)系進(jìn)行深入研究和闡述。真核細(xì)胞在基因表達(dá)過(guò)程中的多個(gè)水平都存在調(diào)控機(jī)制,主要包括轉(zhuǎn)錄水平、RNA剪接水平、mRNA穩(wěn)定性水平、翻譯水平和翻譯后水平等的調(diào)控。本文主要從轉(zhuǎn)錄水平、mRNA
8、穩(wěn)定性水平兩個(gè)層面對(duì)基因表達(dá)調(diào)控系統(tǒng)進(jìn)行研究。
在mRNA穩(wěn)定性水平的調(diào)控層面,本文重點(diǎn)關(guān)注一類(lèi)具有重要生物調(diào)控作用的非編碼RNA——microRNA。我們通過(guò)對(duì)microRNA分子濃度與基因mRNA豐度之間的定量關(guān)系進(jìn)行統(tǒng)計(jì)建模,研究microRNA與其靶基因之間的復(fù)雜調(diào)控關(guān)系。與其它已知方法相比,我們所構(gòu)建的Lasso回歸模型,可以更準(zhǔn)確地發(fā)現(xiàn)microRNA與基因之間的調(diào)控關(guān)系。在該模型的基礎(chǔ)上,利用前列腺癌臨床樣本的表
9、達(dá)譜數(shù)據(jù),構(gòu)建了前列腺癌發(fā)生和轉(zhuǎn)移兩個(gè)不同時(shí)期的microRNA-gene調(diào)控網(wǎng)絡(luò)。通過(guò)對(duì)這兩個(gè)調(diào)控網(wǎng)絡(luò)的分析和比較,我們發(fā)現(xiàn)網(wǎng)絡(luò)中存在多個(gè)模塊及關(guān)鍵的microRNA節(jié)點(diǎn),文獻(xiàn)分析顯示這些模塊與前列腺癌的發(fā)生和轉(zhuǎn)移過(guò)程密切相關(guān)。本研究不但發(fā)展了利用臨床表達(dá)譜數(shù)據(jù)準(zhǔn)確構(gòu)建microRNA-gene調(diào)控網(wǎng)絡(luò)的有效方法,而且揭示了microRNA調(diào)控網(wǎng)絡(luò)的模塊化特征。同時(shí),本研究也證明了多元統(tǒng)計(jì)模型在高通量組學(xué)數(shù)據(jù)挖掘中的重要價(jià)值。
10、 在基因轉(zhuǎn)錄水平的調(diào)控層面,我們重點(diǎn)關(guān)注近幾年正在興起的表觀遺傳調(diào)控對(duì)基因表達(dá)的影響。在此方面,我們首先發(fā)展了利用表觀基因組學(xué)數(shù)據(jù)鑒定DNA調(diào)控元件的新方法——DELTA,從隨機(jī)變量概率分布理論出發(fā),系統(tǒng)考慮了DNA調(diào)控元件周?chē)黝?lèi)表觀遺傳修飾的分布形狀特征,并利用支持向量機(jī)對(duì)DNA調(diào)控元件進(jìn)行鑒定。在多個(gè)實(shí)際數(shù)據(jù)中的測(cè)試表明DELTA方法的鑒定準(zhǔn)確性相比其它已知方法有顯著提高。此外,我們還對(duì)啟動(dòng)子區(qū)組蛋白修飾與其所在基因之間的復(fù)雜調(diào)
11、控關(guān)系進(jìn)行定量研究,通過(guò)Lasso回歸模型證明根據(jù)啟動(dòng)子區(qū)組蛋白修飾豐度可以準(zhǔn)確地預(yù)測(cè)基因在多個(gè)細(xì)胞系中表達(dá)水平的變化,提示了組蛋白修飾在維持細(xì)胞系身份(identity)中的重要作用。同時(shí),通過(guò)構(gòu)建組蛋白修飾的基因調(diào)控網(wǎng)絡(luò),我們發(fā)現(xiàn)細(xì)胞系特異基因通常被多個(gè)組蛋白修飾所調(diào)控,說(shuō)明組蛋白修飾是細(xì)胞系特異基因復(fù)雜表達(dá)譜的重要來(lái)源。
由于準(zhǔn)確地鑒定調(diào)控因子和靶基因之間的相互作用關(guān)系是系統(tǒng)研究基因表達(dá)調(diào)控的前提和基礎(chǔ),因此,本文在方法
12、學(xué)上也進(jìn)行了重要探索,主要包括利用Lasso多元線性回歸模型預(yù)測(cè)microRNA與靶基因之間的調(diào)控關(guān)系、利用隨機(jī)變量概率分布理論和支持向量機(jī)預(yù)測(cè)DNA調(diào)控元件以及利用Lasso多元線性回歸模型鑒定組蛋白修飾與基因之間的調(diào)控關(guān)系。這些方法在實(shí)際數(shù)據(jù)測(cè)試中的表現(xiàn)大都優(yōu)于其他已知算法,而且統(tǒng)計(jì)模型的實(shí)際預(yù)測(cè)效果主要取決于數(shù)學(xué)模型與真實(shí)生物過(guò)程之間的耦合程度,而非單純依賴于算法的復(fù)雜度。此外,我們?cè)谘芯恐羞€廣泛使用了復(fù)雜網(wǎng)絡(luò)的構(gòu)建和分析方法,主
13、要包括雙順?lè)醋踊虻牡鞍踪|(zhì)結(jié)構(gòu)域相互作用網(wǎng)絡(luò)、microRNA與靶基因之間的調(diào)控網(wǎng)絡(luò)和組蛋白修飾與靶基因之間的調(diào)控網(wǎng)絡(luò)。這些網(wǎng)絡(luò)分析方法是發(fā)掘基因表達(dá)調(diào)控復(fù)雜系統(tǒng)背后內(nèi)在運(yùn)行規(guī)律的有力手段。
基因表達(dá)調(diào)控是一個(gè)復(fù)雜的生物學(xué)過(guò)程,生物分子網(wǎng)絡(luò)層次的研究有助于從系統(tǒng)水平理解其運(yùn)行機(jī)制,揭示網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)與生物功能之間的內(nèi)在關(guān)系,是研究復(fù)雜生物系統(tǒng)的重要方法。在此基礎(chǔ)上,我們將在以后的研究中考慮整合多種類(lèi)型的分子網(wǎng)絡(luò)對(duì)生物系統(tǒng)進(jìn)行模擬
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 真核基因表達(dá)調(diào)控
- 真核生物CpG序列甲基化對(duì)基因表達(dá)調(diào)控的影響的研究.pdf
- 基于短時(shí)序基因表達(dá)數(shù)據(jù)的動(dòng)態(tài)調(diào)控網(wǎng)絡(luò)建模方法研究.pdf
- 48227.真核生物基因結(jié)構(gòu)預(yù)測(cè)方法研究
- 真核生物基因結(jié)構(gòu)
- 生物基因表達(dá)數(shù)據(jù)分析與建模方法研究.pdf
- 25073.真核生物相鄰基因共表達(dá)機(jī)制的研究
- 大菱鲆基因克隆及真核表達(dá)研究.pdf
- 基于混合核函數(shù)的間歇過(guò)程統(tǒng)計(jì)建模和監(jiān)測(cè)方法研究.pdf
- 真核生物基因組結(jié)構(gòu)自動(dòng)注釋系統(tǒng)研究.pdf
- 真核生物基因組中雙向轉(zhuǎn)錄基因?qū)Φ南到y(tǒng)研究.pdf
- 凋亡素基因原核及真核表達(dá)載體構(gòu)建研究.pdf
- 克隆原核及真核生物耐鹽相關(guān)基因研究.pdf
- 新城疫病毒F基因在真核及原核表達(dá)系統(tǒng)中的表達(dá).pdf
- 原核表達(dá)系統(tǒng)的真核化及其在基因免疫中的應(yīng)用.pdf
- 基因表達(dá)調(diào)控網(wǎng)絡(luò)的構(gòu)建方法研究.pdf
- 油茶PAL基因的全長(zhǎng)克隆及其在原核和真核生物中的表達(dá).pdf
- 基于核的多元統(tǒng)計(jì)回歸方法研究.pdf
- 豬Rspo3基因的原核及真核表達(dá)研究.pdf
- 3個(gè)水稻Osvdac基因的原核和真核表達(dá)研究.pdf
評(píng)論
0/150
提交評(píng)論