版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)作為第三代分子標記,具有分布豐富、穩(wěn)定遺傳、快速檢測等特點,在分子標記輔助選擇、種子純度鑒定、目標基因定位、遺傳圖譜構(gòu)建和全基因組關(guān)聯(lián)分析(Genome Wide Association Study,GWAS)等方面均具有廣泛的應(yīng)用。玉米經(jīng)過長期的自然選擇與人工馴化,形成了豐富的遺傳變異,已成為作物遺傳學(xué)研究的經(jīng)典模式植物。然而,其基因組中大量重復(fù)序列
2、和轉(zhuǎn)座子的存在也為玉米變異檢測帶來了困難與挑戰(zhàn)。
為揭示不同SNP檢測流程、測序覆蓋度及測序讀長對玉米SNP檢測結(jié)果的影響,本研究利用玉米基因組的堿基編碼分布、GC偏好性等特征模擬不同覆蓋度及測序讀長的高通量測序數(shù)據(jù),分別利用4個流程SAMtools、GATK-UnifiedGenotyper、VarScan和FreeBayes進行SNP檢測,進一步從SNP檢出率、假陽性率、程序運行效率等方面綜合比較不同覆蓋度、測序讀長以及不
3、同檢測流程對玉米SNP檢測效率的影響,從而獲得玉米SNP檢測的最佳流程和較高的“價效比”測序組合。
首先,本研究利用pIRS程序根據(jù)玉米參考基因組序列構(gòu)建了玉米特征譜,模擬了不同覆蓋度和不同讀長的Illumina測序數(shù)據(jù),隨后使用4種不同流程進行SNP檢測。結(jié)果發(fā)現(xiàn),VarScan、SAMtools和GATK-UnifiedGenotyper流程SNP檢測正確率較高,而FreeBayes流程假陽性率較高。在低覆蓋度(<8倍)時
4、,SAMtools與GATK-UnifiedGenotyper的正確率較高,然而,SAMtools流程的SNP檢出率較之后者高約15%;當覆蓋度在8倍及以上時,F(xiàn)reeBayes、SAMtools和GATK-UnifiedGenotyper流程SNP檢出率較高,而VarScan流程SNP檢出率則較低;在較高覆蓋度(≥30倍)時,4個流程的SNP檢出率趨于一致。此外,在高覆蓋度下對4個不同流程的檢測數(shù)據(jù)進一步取交集,發(fā)現(xiàn)SNP檢測正確率可
5、高達99.98%。因此,低覆蓋度(<8倍)下,利用SAMtools流程檢測較為適宜;而中高覆蓋度(≥8倍)下,不同檢測程序均保持較高的檢出率和正確率,其中GATK-UnifiedGenotyper流程有較佳的性能表現(xiàn),對不同檢測結(jié)果進行交集處理可進一步提高SNP檢測的準確率。
其次,相應(yīng)的最優(yōu)流程對不同覆蓋度和不同讀長數(shù)據(jù)的SNP檢測結(jié)果表明,在玉米中,雙端100 bp(basepair)長、15倍覆蓋度測序組合,GATK-U
6、nifiedGenotyper流程的SNP檢出率約為85.9%,正確率約為99.84%;雙端150 bp長、8倍覆蓋度測序組合,GATK-UnifiedGenotyper流程的SNP檢出率約為86.4%,正確率約為99.92%;雙端250 bp長、5倍覆蓋度測序組合,SAMtools流程SNP檢出率約為81.6%,正確率約為99.82%。因此,采用雙端150bp測序長度、8倍覆蓋度測序組合可得到玉米SNP檢測的較高“價效比”。
7、 為了進一步驗證玉米優(yōu)化的SNP檢測流程的可靠性,本研究分別利用VarScan流程和中高覆蓋度較優(yōu)流程GATK-UnifiedGenotyper對玉米自交系H99(Paired-end100×2 bp,~11x)重測序數(shù)據(jù)進行了SNP檢測,分別檢測到4,878,937個SNP和6,885,936個SNP。隨后,從檢測結(jié)果中選取GATK-UnifiedGenotyper流程檢測,而VarScan流程未檢測到的SNP位點設(shè)計引物并測序驗證。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高通量測序數(shù)據(jù)存儲系統(tǒng)
- 高通量DNA測序數(shù)據(jù)的分布密度分析及其應(yīng)用.pdf
- 基于高通量測序數(shù)據(jù)的遺傳調(diào)控元件識別及算法研究.pdf
- 11574.高通量測序數(shù)據(jù)誤差分析方法研究
- 基于一下代測序的玉米高通量SNP開發(fā)及關(guān)聯(lián)分析.pdf
- 高通量測序
- Docker生物云計算平臺分析松材線蟲高通量測序數(shù)據(jù)的應(yīng)用研究.pdf
- 高通量RNA-seq測序數(shù)據(jù)的基因表達水平分析研究.pdf
- 基于微陣列技術(shù)的功能SNP高通量檢測及其應(yīng)用.pdf
- 基于二代測序數(shù)據(jù)的SNP發(fā)現(xiàn)策略及其初步應(yīng)用.pdf
- 高通量測序技術(shù)簡介
- 高通量測序在腫瘤臨床中的應(yīng)用
- 新發(fā)病毒性傳染病病原體高通量測序數(shù)據(jù)分析.pdf
- 高通量測序在乙肝相關(guān)肝癌患者HBV變異檢測中的應(yīng)用.pdf
- 基于高通量測序技術(shù)的miRNA分析策略及數(shù)據(jù)挖掘研究.pdf
- 高通量測序數(shù)據(jù)中病毒基因組的生物信息學(xué)分析方法探索.pdf
- 高通量基因篩選技術(shù)的應(yīng)用及優(yōu)化.pdf
- 高通量SSR檢測方法在玉米遺傳圖譜構(gòu)建中的應(yīng)用.pdf
- 基于高通量測序的芥菜結(jié)構(gòu)變異(SV)標記開發(fā)及應(yīng)用.pdf
- 桉樹基因測序數(shù)據(jù)SNP的模式識別方法的研究.pdf
評論
0/150
提交評論