基于高通量測(cè)序技術(shù)的全基因組甲基化研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩92頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、高通量測(cè)序技術(shù)具有測(cè)序速度快、成本低、通量高等優(yōu)點(diǎn),其發(fā)展給生物學(xué)多個(gè)領(lǐng)域的研究帶來(lái)了一場(chǎng)空前的革命。DNA甲基化和基因表達(dá)、基因印跡、發(fā)育、衰老、癌癥發(fā)生等生物過(guò)程有著密切的關(guān)系。DNA甲基化在全基因組上的分布,對(duì)于系統(tǒng)性的研究DNA甲基化在上述生物過(guò)程中的作用有著重要的作用。以往,基因組DNA甲基化的研究由于受限于檢測(cè)方法,往往僅限于基因組的局部區(qū)域和位點(diǎn)。即使將高密度基因芯片應(yīng)用到DNA甲基化研究領(lǐng)域,由于全基因組覆蓋式芯片價(jià)格昂

2、貴,所以一些研究往往也只能覆蓋有限的CpG島或者是部分染色體。高通量測(cè)序技術(shù)的問(wèn)世,為真正意義上的全基因組甲基化檢測(cè)提供了一個(gè)有力的工具。本論文以白血病細(xì)胞系K562為研究對(duì)象,結(jié)合高通量測(cè)序技術(shù)和甲基化DNA免疫沉淀技術(shù)(MeDIP-Seq)對(duì)全基因組DNA甲基化檢測(cè)進(jìn)行了研究,重點(diǎn)研究了MeDIP-Seq的文庫(kù)制備方法、數(shù)據(jù)分析方法以及K562細(xì)胞系的全基因組甲基化分布特征。主要研究?jī)?nèi)容和成果如下:
   1.用于全基因組D

3、NA甲基化分析的MeDIP-Seq文庫(kù)制備方法。
   MeDIP-Seq是一種全新的全基因組甲基化分析方法。它是將甲基化DNA免疫沉淀和高通量DNA測(cè)序技術(shù)結(jié)合在一起的一種策略。甲基化DNA免疫沉淀技術(shù),使用甲基化胞嘧啶抗體,或者甲基化結(jié)合蛋白,將甲基化DNA片段從非甲基化片段中有效的分離出來(lái)。甲基化DNA免疫沉淀技術(shù)和高通量測(cè)序技術(shù)相結(jié)合,可以有效的識(shí)別基因組中甲基化的片段,從而繪制全基因組的DNA甲基化圖譜。該方法相比較與

4、亞硫酸氫鹽反轉(zhuǎn)測(cè)序的優(yōu)點(diǎn)在于,不需要較多的測(cè)序通量、成本低,數(shù)據(jù)處理方法簡(jiǎn)單,無(wú)需高性能運(yùn)算服務(wù)器用于大規(guī)模的基因組拼接。但是,在實(shí)際應(yīng)用中MeDIP技術(shù)和高通量測(cè)序技術(shù)結(jié)合主要存在兩點(diǎn)障礙:1)MeDIP的產(chǎn)物量太少。4-5μg的全基因組DNA底物,經(jīng)過(guò)MeDIP免疫沉淀后,大約能夠得到200ng左右的MeDIP產(chǎn)物。這個(gè)量對(duì)于制備高通量測(cè)序文庫(kù)有一定的難度。2)基因組DNA經(jīng)過(guò)MeDIP反應(yīng)之后,由原來(lái)的雙鏈DNA變成單鏈DNA。因

5、為anti-5mC抗體識(shí)別單鏈DNA上甲基化胞嘧啶效果較好,所以在免疫沉淀之前,基因組DNA經(jīng)過(guò)了變性的過(guò)程,而單鏈DNA并不適合制備高通量測(cè)序文庫(kù)。為此,我們?cè)O(shè)計(jì)了一對(duì)帶有酶切位點(diǎn)的通用接頭,在MeDIP之前將接頭連接到DNA片段兩端。MeDIP完成后,利用通用引物對(duì)MeDIP產(chǎn)物進(jìn)行擴(kuò)增,再利用特異性內(nèi)切酶將接頭完全切除,以制備高通量測(cè)序文庫(kù)。我們用該方法成功的制備了白血病細(xì)胞系K562的MeDIP-Seq測(cè)序文庫(kù),并用亞硫酸氫鹽反

6、轉(zhuǎn)測(cè)序結(jié)果驗(yàn)證了所制備文庫(kù)的測(cè)序結(jié)果,結(jié)果顯示兩者呈現(xiàn)顯著相關(guān)性(R2=0.92,Pearson檢驗(yàn))。我們用兩次重復(fù)實(shí)驗(yàn)驗(yàn)證了文庫(kù)制備方法的可重復(fù)性,結(jié)果顯示兩次實(shí)驗(yàn)的測(cè)序reads分布呈顯著相關(guān)性(R2=0.92,Pearson檢驗(yàn))。結(jié)果證明我們的方法提供了一種穩(wěn)定、可靠的MeDIP-Seq文庫(kù)制備策略。
   2.基于SOLiD測(cè)序方法的改進(jìn)型MeDIP-Seq文庫(kù)制備方法。
   我們開發(fā)的原始MeDIP-Se

7、q文庫(kù)制備方法使用了包含內(nèi)切酶識(shí)別位點(diǎn)的通用接頭。這種接頭的使用克服了MeDIP文庫(kù)量少、單鏈,這兩個(gè)不利于制備測(cè)序文庫(kù)的缺點(diǎn)。同時(shí)這種接頭也引入了另外一些風(fēng)險(xiǎn),主要包括:1)酶切不完全,導(dǎo)致測(cè)序文庫(kù)包含接頭序列;2)酶切可能破壞文庫(kù)中其他包含有該酶切位點(diǎn)的區(qū)域:3)酶切以及酶切完成后的文庫(kù)純化造成測(cè)序文庫(kù)損失。為此,我們?cè)O(shè)計(jì)了一種無(wú)需切除通用接頭的MeDIP-Seq文庫(kù)的制備方法。這種方法借助了制備測(cè)序文庫(kù)的SOLiD接頭來(lái)擴(kuò)增MeD

8、IP文庫(kù),而取代了外源接頭。且該方法制備的測(cè)序文庫(kù)只包含MeDIP產(chǎn)物的兩端序列,不包含MeDIP產(chǎn)物的中間序列,提高了MeDIP產(chǎn)物的測(cè)序效率,同時(shí)為從測(cè)序reads定位MeDIP產(chǎn)物提供了更準(zhǔn)確的方法。我們比較了該方法和原始方法制備的兩組文庫(kù)的測(cè)序reads,證明該制備方法并沒有產(chǎn)生任何偏向性,且和原始方法制備的文庫(kù)有顯著相關(guān)性(R2=0.92,Pearson檢驗(yàn))。同時(shí)結(jié)果顯示該方法制備的文庫(kù)相對(duì)于原始方法,可用reads的比例有

9、一定程度的提高。結(jié)果證明優(yōu)化后的方法能夠提供更好的MeDIP-Seq文庫(kù)制備方法。
   3.MeDIP-Seq測(cè)序數(shù)據(jù)的生物信息學(xué)分析研究。
   利用MeDIP-Seq技術(shù)來(lái)繪制全基因組甲基化圖譜的一個(gè)重要的關(guān)鍵點(diǎn)在于如何從龐大的、復(fù)雜無(wú)序的測(cè)序數(shù)據(jù)中提取DNA甲基化的分布信息。本論文提出了一種基于泊松分布的搜峰方法,通過(guò)MeDIP-Seq數(shù)據(jù)在全基因組范圍內(nèi)識(shí)別甲基化區(qū)域。在這項(xiàng)研究中,我們分別比較了不同的分布模型

10、和搜峰窗寬對(duì)結(jié)果的影響。我們用泊松分布和負(fù)二項(xiàng)分布來(lái)擬合MeDIP-Seq數(shù)據(jù),比較研究的結(jié)果顯示泊松分布更適合于MeDIP-Seq數(shù)據(jù)的分析。我們對(duì)不同搜峰窗寬對(duì)結(jié)果的影響進(jìn)行比較,結(jié)果顯示取MeDIP產(chǎn)物的長(zhǎng)度(500bp)為搜峰窗寬可得到最好的效果。另外,我們還研究了用MeDIP-Seq數(shù)據(jù)推算DNA的絕對(duì)甲基化水平。結(jié)果顯示相對(duì)于我們開發(fā)的基于泊松分布的搜峰方法,該工作需要更多量的測(cè)序數(shù)據(jù)。研究結(jié)果表明,基于泊松分布的搜峰方法可

11、以作為一種可靠、準(zhǔn)確的MeDIP-Seq數(shù)據(jù)分析工具。
   4.K562細(xì)胞系全基因組甲基化分析。
   我們以白血病細(xì)胞K562為研究對(duì)象,利用MeDIP-Seq的測(cè)序結(jié)果,繪制了K562細(xì)胞的全基因組甲基化圖譜,識(shí)別了約1.4×105個(gè)不短于500bp的甲基化區(qū)域,并對(duì)甲基化區(qū)域在轉(zhuǎn)錄起始位點(diǎn)上游區(qū)(TSS-upstream)、轉(zhuǎn)錄終止位點(diǎn)下游區(qū)(TES-downstream)、3’非翻譯區(qū)(3’untransla

12、ted region,3'UTR)、5’非翻譯區(qū)(5’untranslated region,5’UTR)、內(nèi)含子(Intron)、外顯子(Exon)等特征區(qū)域的分布進(jìn)行了描述。我們還對(duì)基因啟動(dòng)子區(qū)、CpG島的甲基化進(jìn)行了研究。研究結(jié)果表明DNA甲基化更趨向于分布在基因的3’末端、基因間區(qū)而非基因的5’末端,同時(shí)我們發(fā)現(xiàn)了部分已經(jīng)被證明和癌癥、白血病相關(guān)的抑癌基因的啟動(dòng)子區(qū)發(fā)生甲基化。同時(shí)我們分析了DNA甲基化和CpG位點(diǎn)密度的關(guān)系,結(jié)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論