版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、癌癥的發(fā)生和發(fā)展規(guī)律一直是癌癥相關(guān)研究的焦點(diǎn)。癌癥基因組拷貝數(shù)變異檢測(cè)是發(fā)現(xiàn)癌癥相關(guān)基因的基礎(chǔ),因此成為很多癌癥研究的首要任務(wù)。隨著高通量DNA測(cè)序技術(shù)的發(fā)展,癌癥基因組學(xué)研究的實(shí)驗(yàn)手段已經(jīng)從傳統(tǒng)的比較基因組雜交和單核苷酸多態(tài)性等陣列技術(shù)逐步過渡到下一代測(cè)序技術(shù)。
由于數(shù)據(jù)量龐大,高效分析下一代測(cè)序數(shù)據(jù)成為相關(guān)領(lǐng)域的一個(gè)難點(diǎn)。另外,腫瘤樣本通常存在正常細(xì)胞污染、基因組非整倍性和腫瘤異質(zhì)性等復(fù)雜問題。這些問題都會(huì)對(duì)測(cè)序數(shù)據(jù)產(chǎn)生不
2、可忽視的干擾,從而嚴(yán)重影響拷貝數(shù)變異檢測(cè)的準(zhǔn)確性。因此,癌癥基因組拷貝數(shù)變異檢測(cè)算法需有效解決上述關(guān)鍵問題。
本文通過對(duì)腫瘤下一代測(cè)序數(shù)據(jù)進(jìn)行分析和總結(jié),設(shè)計(jì)和開發(fā)出幾種不同應(yīng)用背景下基因組拷貝數(shù)變異檢測(cè)的算法和工具,主要的研究?jī)?nèi)容和成果總結(jié)如下:
1.提出了一種從非成對(duì)腫瘤全基因組測(cè)序數(shù)據(jù)中檢測(cè)拷貝數(shù)變異和雜合性缺失的算法CLImAT,可自動(dòng)修正正常細(xì)胞污染和腫瘤非整倍性對(duì)全基因組測(cè)序數(shù)據(jù)產(chǎn)生的影響。首先,該算法采
3、用了有效的信號(hào)校正和標(biāo)準(zhǔn)化過程,包括一種非參數(shù)方法校正讀深信號(hào)中的GC和mapppability偏差,以及一種分位數(shù)標(biāo)準(zhǔn)化方法校正等位基因頻率偏差。其次,該算法中引入了一種新穎的隱馬爾科夫模型用于聯(lián)合分析讀深和等位基因頻率,并對(duì)正常細(xì)胞污染和腫瘤倍性進(jìn)行了參數(shù)化建模,從而可靠檢測(cè)腫瘤基因組拷貝數(shù)變異和雜合性缺失。最后,通過在多個(gè)數(shù)據(jù)集上的性能評(píng)估,表明CLImAT在處理復(fù)雜腫瘤樣本的全基因組測(cè)序數(shù)據(jù)時(shí)具有明顯優(yōu)勢(shì)。
2.提出了
4、一種從異質(zhì)性腫瘤全基因組測(cè)序數(shù)據(jù)中檢測(cè)不同克隆群體基因組拷貝數(shù)變異和雜合性缺失的算法CLImAT-HET。該算法考慮了腫瘤異質(zhì)性對(duì)全基因組測(cè)序數(shù)據(jù)的影響,并采用階乘隱馬爾科夫模型對(duì)數(shù)據(jù)進(jìn)行分析。CLImAT-HET的優(yōu)勢(shì)主要體現(xiàn)在以下三個(gè)方面:1)對(duì)多個(gè)克隆群體產(chǎn)生的混合信號(hào)進(jìn)行合理分解,明顯提高了拷貝數(shù)變異和雜合性缺失的檢測(cè)性能;2)對(duì)細(xì)胞比例較小的亞克隆群體中的基因組變異更加敏感;3)能估計(jì)每個(gè)腫瘤克隆群體的細(xì)胞比例。
3
5、.提出了一種利用腫瘤和正常樣本的成對(duì)外顯子測(cè)序數(shù)據(jù)檢測(cè)拷貝數(shù)變異的算法CloneCNA。該算法采取有效的數(shù)據(jù)預(yù)處理方法,減輕了正常細(xì)胞污染、腫瘤基因組非整倍性和腫瘤異質(zhì)性等問題對(duì)外顯子測(cè)序數(shù)據(jù)的影響。CloneCNA中也采用了階乘隱馬爾科夫模型用于分析腫瘤克隆群體及其基因組拷貝數(shù)變異和雜合性缺失,并對(duì)正常細(xì)胞污染、腫瘤倍性和腫瘤異質(zhì)性進(jìn)行了參數(shù)化建模,從而可靠檢測(cè)出不同克隆群體的拷貝數(shù)變異。此外,該算法利用貝葉斯信息準(zhǔn)則評(píng)估不同腫瘤克隆
6、群體數(shù)目下模型的復(fù)雜度,并選取最優(yōu)的克隆群體數(shù)目。通過在多個(gè)測(cè)試數(shù)據(jù)集上的性能評(píng)估,表明CloneCNA具有優(yōu)異的拷貝數(shù)變異檢測(cè)性能。
4.設(shè)計(jì)了一種從外顯子測(cè)序數(shù)據(jù)中檢測(cè)拷貝數(shù)變異并對(duì)其進(jìn)行注釋的在線生物信息學(xué)工具DeAnnCNV。該工具能同時(shí)處理多個(gè)樣本的外顯子測(cè)序數(shù)據(jù),準(zhǔn)確檢測(cè)出拷貝數(shù)變異并提供詳細(xì)的可視化結(jié)果。此外,該工具中集成了現(xiàn)有的生物信息學(xué)數(shù)據(jù)庫資源,可對(duì)出現(xiàn)在多個(gè)樣本中的拷貝數(shù)變異進(jìn)行多方面注釋并提供有用的功能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于下一代測(cè)序技術(shù)的拷貝數(shù)變異檢測(cè)方法研究.pdf
- 基于家系基因測(cè)序數(shù)據(jù)的拷貝數(shù)變異檢測(cè)方法研究.pdf
- 全基因組拷貝數(shù)變異和拷貝數(shù)平衡的雜合性缺失分析獲得LCPD基因.pdf
- 全基因組拷貝數(shù)變異與卵巢腫瘤異質(zhì)性的關(guān)聯(lián)研究.pdf
- 全基因組拷貝數(shù)變異檢測(cè)在產(chǎn)前高通量測(cè)序異常信號(hào)分析中的應(yīng)用研究.pdf
- 中國(guó)女性全基因組拷貝數(shù)變異與初潮年齡的關(guān)聯(lián)研究.pdf
- 無創(chuàng)產(chǎn)前DNA檢測(cè)應(yīng)用于基因組拷貝數(shù)變異的臨床診斷意義.pdf
- 全基因組芯片技術(shù)在先天性心臟病基因組拷貝數(shù)變異中的研究.pdf
- 基于二代測(cè)序的基因組缺失變異綜合檢測(cè)策略.pdf
- 下一代測(cè)序短序列比對(duì)軟件算法比較及評(píng)價(jià).pdf
- 下一代測(cè)序工作流程自動(dòng)化
- 基于讀深方法的拷貝數(shù)變異檢測(cè)研究.pdf
- 基于表型不一致同胞對(duì)的食管鱗癌全基因組拷貝數(shù)變異分析.pdf
- 基于IMS的下一代網(wǎng)絡(luò)研究.pdf
- 產(chǎn)前先天性心臟病胎兒的全基因組基因拷貝數(shù)變異分析.pdf
- “招安”家族下一代
- 下一代網(wǎng)絡(luò)(NGN)研究.pdf
- 9個(gè)中外豬品種全基因組選擇區(qū)域及拷貝數(shù)變異分析.pdf
- 下一代測(cè)序技術(shù)在十二例三陰性乳腺癌全外顯組測(cè)序的初步研究.pdf
- 基于博弈的下一代網(wǎng)絡(luò)計(jì)費(fèi)研究.pdf
評(píng)論
0/150
提交評(píng)論