

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著高通量測(cè)序技術(shù)的迅猛發(fā)展,基因組學(xué)測(cè)序數(shù)據(jù)正以史無(wú)前例的規(guī)模迅猛增長(zhǎng)。面對(duì)大數(shù)據(jù)的出現(xiàn),生物學(xué)者由于數(shù)據(jù)存儲(chǔ)和處理能力的限制往往局限于初始的有限的分析,導(dǎo)致新穎的更深層有價(jià)值的信息的丟失。高通量測(cè)序數(shù)據(jù)的生物信息學(xué)分析越來(lái)越離不開(kāi)計(jì)算機(jī)手段與數(shù)學(xué)模型的幫助。基因表達(dá)是一個(gè)復(fù)雜的生物學(xué)過(guò)程,生物體內(nèi)基因的正常表達(dá)對(duì)其發(fā)育、分化及復(fù)雜疾病的發(fā)生發(fā)展具有重要意義。影響基因轉(zhuǎn)錄調(diào)控的因素包括遺傳、表觀遺傳以及環(huán)境等因子的作用,轉(zhuǎn)錄調(diào)控機(jī)制的
2、精確解析有助于理解人類個(gè)體間表型的差異甚至疾病發(fā)生的來(lái)源。本文針對(duì)高通量RNA測(cè)序數(shù)據(jù),結(jié)合遺傳變異和表觀遺傳變異信息借助計(jì)算機(jī)方法和數(shù)學(xué)模型從全基因組范圍內(nèi)挖掘影響編碼基因、雙向啟動(dòng)子和非編碼基因的轉(zhuǎn)錄調(diào)控元件包括遺傳調(diào)控位點(diǎn)以及單核苷酸多態(tài)-DNA甲基化的調(diào)控模式。
首先,本文在全基因組范圍內(nèi)利用最大似然模型預(yù)測(cè)人類個(gè)體內(nèi)以及個(gè)體間顯示等位特異表達(dá)的基因,并對(duì)其等位特異表達(dá)的程度進(jìn)行量化。等位特異表達(dá)基因的識(shí)別對(duì)于基因表達(dá)
3、調(diào)控元件甚至疾病風(fēng)險(xiǎn)等位的研究是至關(guān)重要的。盡管RNA測(cè)序技術(shù)在等位的水平上提供了基因表達(dá)的數(shù)據(jù),然而在個(gè)體間中篩選等位特異表達(dá)基因的統(tǒng)計(jì)模型仍然缺乏。本文考慮基因內(nèi)多個(gè)單核苷酸多態(tài)位點(diǎn)等位表達(dá)異質(zhì)性的特點(diǎn),提出利用貝塔-二項(xiàng)分布構(gòu)建最大似然模型識(shí)別等位特異表達(dá)基因。模擬數(shù)據(jù)從數(shù)據(jù)覆蓋程度、等位特異表達(dá)程度、基因內(nèi)顯示等位特異表達(dá)的單核苷酸多態(tài)的比例以及隨機(jī)噪音等5個(gè)角度顯示預(yù)測(cè)模型具有高度的準(zhǔn)確性和穩(wěn)定性。將該方法應(yīng)用到不同個(gè)體的人類
4、數(shù)據(jù)中結(jié)果發(fā)現(xiàn),全基因組范圍中大約17%的基因在個(gè)體內(nèi)顯示等位特異表達(dá)。由于個(gè)體間的差異,更多比例的基因在個(gè)體間顯示等位特異表達(dá)。
第二,本文基于高通量RNA測(cè)序數(shù)據(jù)利用全基因組范圍的關(guān)聯(lián)分析對(duì)雙向基因?qū)Φ倪z傳調(diào)控位點(diǎn)進(jìn)行挖掘,認(rèn)為雙向啟動(dòng)子存在兩種轉(zhuǎn)錄調(diào)控機(jī)制的作用。人類基因組中存在大量的轉(zhuǎn)錄起始位點(diǎn)之間距離小于1000 bp,而且轉(zhuǎn)錄方向相反的基因?qū)?,一般被稱為雙向基因?qū)?。雙向基因?qū)赡苡捎诠蚕硐嗤膯?dòng)子區(qū)域(雙向啟動(dòng)子
5、)而具有相似的表達(dá)模式。然而,雙向基因?qū)χg的表達(dá)相關(guān)性盡管高于隨機(jī)基因?qū)?,但是低于共享相同遺傳調(diào)控位點(diǎn)的基因?qū)?,因此認(rèn)為雙向基因?qū)χg的表達(dá)相關(guān)性存在差異。本文利用人類群體的高通量RNA測(cè)序數(shù)據(jù)分析雙向基因?qū)χg表達(dá)相關(guān)性差異的原因,通過(guò)全基因組范圍的關(guān)聯(lián)分析結(jié)果發(fā)現(xiàn)位于雙向啟動(dòng)子內(nèi)的遺傳變異不僅與雙向基因?qū)Φ谋磉_(dá)相關(guān),同時(shí)與雙向基因?qū)χg的表達(dá)相關(guān)性顯著關(guān)聯(lián),提出了關(guān)于雙向啟動(dòng)子的兩種轉(zhuǎn)錄調(diào)控機(jī)制。
第三,本文利用人類群體
6、的高通量RNA測(cè)序數(shù)據(jù)對(duì)miRNA的初始轉(zhuǎn)錄本進(jìn)行定量,利用全基因組范圍的關(guān)聯(lián)分析發(fā)現(xiàn)了影響 miRNA轉(zhuǎn)錄的遺傳調(diào)控位點(diǎn)并認(rèn)為是miRNA特有的轉(zhuǎn)錄調(diào)控位點(diǎn)。由于miRNA與編碼基因具有相似的結(jié)構(gòu),本文認(rèn)為RNA測(cè)序數(shù)據(jù)不僅能夠提供關(guān)于編碼基因的信息,而且能夠提供miRNA的表達(dá)信息有助于其轉(zhuǎn)錄調(diào)控機(jī)制的研究。通過(guò)高通量的RNA測(cè)序數(shù)據(jù)對(duì)miRNA初始轉(zhuǎn)錄本的表達(dá)值進(jìn)行量化,隨機(jī)序列、miRNA前體的表達(dá)水平以及基因組相關(guān)區(qū)域的分布驗(yàn)
7、證了miRNA初始轉(zhuǎn)錄本表達(dá)值的可信性。本文利用全基因組范圍的關(guān)聯(lián)分析和多重檢驗(yàn)校正發(fā)現(xiàn)了miRNA的遺傳調(diào)控位點(diǎn)并對(duì)其調(diào)控機(jī)制進(jìn)行探討,結(jié)果顯示盡管這些遺傳位點(diǎn)位于 miRNA及其宿主基因共享的轉(zhuǎn)錄調(diào)控區(qū)域,但是與宿主基因的表達(dá)沒(méi)有顯著關(guān)聯(lián)。
第四,本研究對(duì)單核苷酸多態(tài)、DNA甲基化與基因表達(dá)之間的調(diào)控關(guān)系進(jìn)行了探討,通過(guò)構(gòu)建四種基因表達(dá)調(diào)控模型利用最大似然方法在人類全基因組范圍內(nèi)進(jìn)行預(yù)測(cè),最終發(fā)現(xiàn)人類基因組中存在多種復(fù)雜的
8、單核苷酸多態(tài)-DNA甲基化調(diào)控模式。根據(jù)單核苷酸多態(tài)、DNA甲基化和基因表達(dá)之間不同的相關(guān)程度模擬數(shù)據(jù)的預(yù)測(cè)結(jié)果顯示模型具有令人滿意的預(yù)測(cè)準(zhǔn)確性和相對(duì)的穩(wěn)定性。歐洲和非洲兩種人群中基因表達(dá)調(diào)控模式的預(yù)測(cè)結(jié)果顯示了相似的分布:人類全基因組范圍內(nèi)接近一半的基因分別受到單核苷酸多態(tài)和DNA甲基化獨(dú)立的調(diào)控影響,該模式被稱為協(xié)同/拮抗調(diào)控;不足三分之一基因僅由單一的因素調(diào)。本文提出的協(xié)同/拮抗調(diào)控模式發(fā)現(xiàn)大量的新的與基因表達(dá)相關(guān)的遺傳調(diào)控位點(diǎn),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高通量測(cè)序數(shù)據(jù)存儲(chǔ)系統(tǒng)
- 11574.高通量測(cè)序數(shù)據(jù)誤差分析方法研究
- 高通量DNA測(cè)序數(shù)據(jù)的分布密度分析及其應(yīng)用.pdf
- 玉米高通量測(cè)序數(shù)據(jù)SNP檢測(cè)流程的優(yōu)化及應(yīng)用.pdf
- 高通量RNA-seq測(cè)序數(shù)據(jù)的基因表達(dá)水平分析研究.pdf
- 高通量測(cè)序
- 基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究.pdf
- 基于高通量測(cè)序技術(shù)的miRNA分析策略及數(shù)據(jù)挖掘研究.pdf
- Docker生物云計(jì)算平臺(tái)分析松材線蟲(chóng)高通量測(cè)序數(shù)據(jù)的應(yīng)用研究.pdf
- 高通量測(cè)序技術(shù)簡(jiǎn)介
- 高通量數(shù)據(jù)特征選擇算法研究.pdf
- 基于高通量測(cè)序半夏珠芽轉(zhuǎn)錄組研究.pdf
- 高通量轉(zhuǎn)錄組測(cè)序片段快速比對(duì)算法研究.pdf
- 基于高通量測(cè)序技術(shù)的非編碼RNA研究.pdf
- 新發(fā)病毒性傳染病病原體高通量測(cè)序數(shù)據(jù)分析.pdf
- 高通量測(cè)序數(shù)據(jù)中病毒基因組的生物信息學(xué)分析方法探索.pdf
- 基于高通量測(cè)序的中國(guó)甜柿microRNAs鑒定及分析.pdf
- 基于高通量測(cè)序的木麻黃轉(zhuǎn)錄組分析.pdf
- 基于高通量測(cè)序的狼和家犬血液轉(zhuǎn)錄組研究.pdf
- 高通量測(cè)序意向登記表
評(píng)論
0/150
提交評(píng)論