

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著高通量測序技術(shù)的迅猛發(fā)展,基因組學(xué)測序數(shù)據(jù)正以史無前例的規(guī)模迅猛增長。面對大數(shù)據(jù)的出現(xiàn),生物學(xué)者由于數(shù)據(jù)存儲和處理能力的限制往往局限于初始的有限的分析,導(dǎo)致新穎的更深層有價(jià)值的信息的丟失。高通量測序數(shù)據(jù)的生物信息學(xué)分析越來越離不開計(jì)算機(jī)手段與數(shù)學(xué)模型的幫助?;虮磉_(dá)是一個(gè)復(fù)雜的生物學(xué)過程,生物體內(nèi)基因的正常表達(dá)對其發(fā)育、分化及復(fù)雜疾病的發(fā)生發(fā)展具有重要意義。影響基因轉(zhuǎn)錄調(diào)控的因素包括遺傳、表觀遺傳以及環(huán)境等因子的作用,轉(zhuǎn)錄調(diào)控機(jī)制的
2、精確解析有助于理解人類個(gè)體間表型的差異甚至疾病發(fā)生的來源。本文針對高通量RNA測序數(shù)據(jù),結(jié)合遺傳變異和表觀遺傳變異信息借助計(jì)算機(jī)方法和數(shù)學(xué)模型從全基因組范圍內(nèi)挖掘影響編碼基因、雙向啟動子和非編碼基因的轉(zhuǎn)錄調(diào)控元件包括遺傳調(diào)控位點(diǎn)以及單核苷酸多態(tài)-DNA甲基化的調(diào)控模式。
首先,本文在全基因組范圍內(nèi)利用最大似然模型預(yù)測人類個(gè)體內(nèi)以及個(gè)體間顯示等位特異表達(dá)的基因,并對其等位特異表達(dá)的程度進(jìn)行量化。等位特異表達(dá)基因的識別對于基因表達(dá)
3、調(diào)控元件甚至疾病風(fēng)險(xiǎn)等位的研究是至關(guān)重要的。盡管RNA測序技術(shù)在等位的水平上提供了基因表達(dá)的數(shù)據(jù),然而在個(gè)體間中篩選等位特異表達(dá)基因的統(tǒng)計(jì)模型仍然缺乏。本文考慮基因內(nèi)多個(gè)單核苷酸多態(tài)位點(diǎn)等位表達(dá)異質(zhì)性的特點(diǎn),提出利用貝塔-二項(xiàng)分布構(gòu)建最大似然模型識別等位特異表達(dá)基因。模擬數(shù)據(jù)從數(shù)據(jù)覆蓋程度、等位特異表達(dá)程度、基因內(nèi)顯示等位特異表達(dá)的單核苷酸多態(tài)的比例以及隨機(jī)噪音等5個(gè)角度顯示預(yù)測模型具有高度的準(zhǔn)確性和穩(wěn)定性。將該方法應(yīng)用到不同個(gè)體的人類
4、數(shù)據(jù)中結(jié)果發(fā)現(xiàn),全基因組范圍中大約17%的基因在個(gè)體內(nèi)顯示等位特異表達(dá)。由于個(gè)體間的差異,更多比例的基因在個(gè)體間顯示等位特異表達(dá)。
第二,本文基于高通量RNA測序數(shù)據(jù)利用全基因組范圍的關(guān)聯(lián)分析對雙向基因?qū)Φ倪z傳調(diào)控位點(diǎn)進(jìn)行挖掘,認(rèn)為雙向啟動子存在兩種轉(zhuǎn)錄調(diào)控機(jī)制的作用。人類基因組中存在大量的轉(zhuǎn)錄起始位點(diǎn)之間距離小于1000 bp,而且轉(zhuǎn)錄方向相反的基因?qū)Γ话惚环Q為雙向基因?qū)?。雙向基因?qū)赡苡捎诠蚕硐嗤膯幼訁^(qū)域(雙向啟動子
5、)而具有相似的表達(dá)模式。然而,雙向基因?qū)χg的表達(dá)相關(guān)性盡管高于隨機(jī)基因?qū)?,但是低于共享相同遺傳調(diào)控位點(diǎn)的基因?qū)?,因此認(rèn)為雙向基因?qū)χg的表達(dá)相關(guān)性存在差異。本文利用人類群體的高通量RNA測序數(shù)據(jù)分析雙向基因?qū)χg表達(dá)相關(guān)性差異的原因,通過全基因組范圍的關(guān)聯(lián)分析結(jié)果發(fā)現(xiàn)位于雙向啟動子內(nèi)的遺傳變異不僅與雙向基因?qū)Φ谋磉_(dá)相關(guān),同時(shí)與雙向基因?qū)χg的表達(dá)相關(guān)性顯著關(guān)聯(lián),提出了關(guān)于雙向啟動子的兩種轉(zhuǎn)錄調(diào)控機(jī)制。
第三,本文利用人類群體
6、的高通量RNA測序數(shù)據(jù)對miRNA的初始轉(zhuǎn)錄本進(jìn)行定量,利用全基因組范圍的關(guān)聯(lián)分析發(fā)現(xiàn)了影響 miRNA轉(zhuǎn)錄的遺傳調(diào)控位點(diǎn)并認(rèn)為是miRNA特有的轉(zhuǎn)錄調(diào)控位點(diǎn)。由于miRNA與編碼基因具有相似的結(jié)構(gòu),本文認(rèn)為RNA測序數(shù)據(jù)不僅能夠提供關(guān)于編碼基因的信息,而且能夠提供miRNA的表達(dá)信息有助于其轉(zhuǎn)錄調(diào)控機(jī)制的研究。通過高通量的RNA測序數(shù)據(jù)對miRNA初始轉(zhuǎn)錄本的表達(dá)值進(jìn)行量化,隨機(jī)序列、miRNA前體的表達(dá)水平以及基因組相關(guān)區(qū)域的分布驗(yàn)
7、證了miRNA初始轉(zhuǎn)錄本表達(dá)值的可信性。本文利用全基因組范圍的關(guān)聯(lián)分析和多重檢驗(yàn)校正發(fā)現(xiàn)了miRNA的遺傳調(diào)控位點(diǎn)并對其調(diào)控機(jī)制進(jìn)行探討,結(jié)果顯示盡管這些遺傳位點(diǎn)位于 miRNA及其宿主基因共享的轉(zhuǎn)錄調(diào)控區(qū)域,但是與宿主基因的表達(dá)沒有顯著關(guān)聯(lián)。
第四,本研究對單核苷酸多態(tài)、DNA甲基化與基因表達(dá)之間的調(diào)控關(guān)系進(jìn)行了探討,通過構(gòu)建四種基因表達(dá)調(diào)控模型利用最大似然方法在人類全基因組范圍內(nèi)進(jìn)行預(yù)測,最終發(fā)現(xiàn)人類基因組中存在多種復(fù)雜的
8、單核苷酸多態(tài)-DNA甲基化調(diào)控模式。根據(jù)單核苷酸多態(tài)、DNA甲基化和基因表達(dá)之間不同的相關(guān)程度模擬數(shù)據(jù)的預(yù)測結(jié)果顯示模型具有令人滿意的預(yù)測準(zhǔn)確性和相對的穩(wěn)定性。歐洲和非洲兩種人群中基因表達(dá)調(diào)控模式的預(yù)測結(jié)果顯示了相似的分布:人類全基因組范圍內(nèi)接近一半的基因分別受到單核苷酸多態(tài)和DNA甲基化獨(dú)立的調(diào)控影響,該模式被稱為協(xié)同/拮抗調(diào)控;不足三分之一基因僅由單一的因素調(diào)。本文提出的協(xié)同/拮抗調(diào)控模式發(fā)現(xiàn)大量的新的與基因表達(dá)相關(guān)的遺傳調(diào)控位點(diǎn),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高通量測序數(shù)據(jù)存儲系統(tǒng)
- 11574.高通量測序數(shù)據(jù)誤差分析方法研究
- 高通量DNA測序數(shù)據(jù)的分布密度分析及其應(yīng)用.pdf
- 玉米高通量測序數(shù)據(jù)SNP檢測流程的優(yōu)化及應(yīng)用.pdf
- 高通量RNA-seq測序數(shù)據(jù)的基因表達(dá)水平分析研究.pdf
- 高通量測序
- 基于高通量轉(zhuǎn)錄組測序的序列比對算法研究.pdf
- 基于高通量測序技術(shù)的miRNA分析策略及數(shù)據(jù)挖掘研究.pdf
- Docker生物云計(jì)算平臺分析松材線蟲高通量測序數(shù)據(jù)的應(yīng)用研究.pdf
- 高通量測序技術(shù)簡介
- 高通量數(shù)據(jù)特征選擇算法研究.pdf
- 基于高通量測序半夏珠芽轉(zhuǎn)錄組研究.pdf
- 高通量轉(zhuǎn)錄組測序片段快速比對算法研究.pdf
- 基于高通量測序技術(shù)的非編碼RNA研究.pdf
- 新發(fā)病毒性傳染病病原體高通量測序數(shù)據(jù)分析.pdf
- 高通量測序數(shù)據(jù)中病毒基因組的生物信息學(xué)分析方法探索.pdf
- 基于高通量測序的中國甜柿microRNAs鑒定及分析.pdf
- 基于高通量測序的木麻黃轉(zhuǎn)錄組分析.pdf
- 基于高通量測序的狼和家犬血液轉(zhuǎn)錄組研究.pdf
- 高通量測序意向登記表
評論
0/150
提交評論