版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著基因組計(jì)劃對(duì)物種遺傳信息研究的發(fā)展,基因組注釋、短序列比對(duì)分析已成為生物信息學(xué)研究的熱點(diǎn)問(wèn)題。為此,需要建立能夠集成并可視化包含基因組注釋、短序列比對(duì)等基因組數(shù)據(jù)的綜合平臺(tái),采用相關(guān)的計(jì)算機(jī)技術(shù)有效管理數(shù)據(jù),并能使生物學(xué)家在web上訪(fǎng)問(wèn)和使用。JBrowse等基因組瀏覽器將基因組數(shù)據(jù)在瀏覽器中以簡(jiǎn)單、直觀方式綜合查看已經(jīng)成為解決此類(lèi)問(wèn)題的有效途徑。JBrowse以其基于AJAX的交互操作、多軌道瀏覽、采用索引技術(shù)等多個(gè)特點(diǎn)成為使用廣
2、泛的基因?yàn)g覽器之一。為了提高JBrowse的平臺(tái)通用性和檢索效率,本文基于該平臺(tái)進(jìn)行數(shù)據(jù)集成及數(shù)據(jù)檢索改進(jìn),集成基因組注釋和比對(duì)短序列并實(shí)現(xiàn)基因組數(shù)據(jù)可視化的綜合瀏覽,優(yōu)化JBrowse對(duì)基因組數(shù)據(jù)的索引進(jìn)而提高平臺(tái)的檢索性能。針對(duì)上述內(nèi)容本文所做的研究工作包含以下兩個(gè)部分:
(1)本文研究了基因組數(shù)據(jù)的共同特征,從數(shù)據(jù)集成的角度出發(fā),基于JBrowse框架提出一個(gè)基因組異構(gòu)數(shù)據(jù)整合、轉(zhuǎn)換和集成的流程。通過(guò)分析現(xiàn)有基因?yàn)g覽器的
3、特點(diǎn),本文更改了配置操作并設(shè)計(jì)擴(kuò)展了數(shù)據(jù)源轉(zhuǎn)換接口,使平臺(tái)支持生物網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、基因注釋及序列比對(duì)信息數(shù)據(jù)文件等各種數(shù)據(jù)源的靈活接入,針對(duì)不同的數(shù)據(jù)源文件格式,創(chuàng)建了相應(yīng)文件轉(zhuǎn)換腳本,將其轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù),使生物學(xué)家能夠在一個(gè)平臺(tái)對(duì)同一物種不同來(lái)源及格式的基因組數(shù)據(jù)進(jìn)行集成綜合瀏覽。
(2)本文研究了平臺(tái)功能及性能,從數(shù)據(jù)檢索的角度出發(fā),基于Tabix索引對(duì)JBrowse的數(shù)據(jù)檢索模塊進(jìn)行優(yōu)化。本文建立了高效的索引模型,提
4、高了平臺(tái)對(duì)基因組數(shù)據(jù)的檢索效率,降低了查詢(xún)調(diào)用次數(shù)并減少數(shù)據(jù)讀取量。本文還針對(duì)Tabix索引在比對(duì)短序列數(shù)據(jù)檢索時(shí)的不足提出按固定序列數(shù)裝箱的改進(jìn)方法,為T(mén)abix索引的裝箱設(shè)定上限,減少在短序列覆蓋率較高區(qū)域所增加的檢索時(shí)間,進(jìn)而提高平臺(tái)訪(fǎng)問(wèn)數(shù)據(jù)的性能。
本文的研究實(shí)現(xiàn)了對(duì)基因組數(shù)據(jù)的轉(zhuǎn)換、整合、可視化以及對(duì)數(shù)據(jù)檢索的優(yōu)化,生物學(xué)研究者可以使用平臺(tái)定制基因組數(shù)據(jù)或下載網(wǎng)絡(luò)基因組數(shù)據(jù),有利于他們進(jìn)行生物學(xué)分析和解釋,對(duì)發(fā)現(xiàn)數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 結(jié)合變異數(shù)據(jù)的基因組索引技術(shù)研究.pdf
- 基于序列拼接的基因組插入變異集成檢測(cè).pdf
- 基因組瀏覽器底層數(shù)據(jù)的分析與集成.pdf
- 基于基因組數(shù)據(jù)的轉(zhuǎn)錄調(diào)控元件分析.pdf
- 面向基因組重測(cè)序的BWT索引壓縮算法.pdf
- 基于特征挖掘與SVM集成的基因組缺失變異檢測(cè).pdf
- 基因、基因組和基因組學(xué)
- 個(gè)人基因組數(shù)據(jù)管理研究.pdf
- 基于基因組數(shù)據(jù)的癌癥亞型發(fā)現(xiàn)聚類(lèi)研究.pdf
- 基因組島數(shù)據(jù)庫(kù)及分析平臺(tái)構(gòu)建.pdf
- 滸苔的線(xiàn)粒體、葉綠體基因組研究及基于轉(zhuǎn)錄組數(shù)據(jù)的SSR分子標(biāo)記開(kāi)發(fā).pdf
- 9247.真核生物基因組注解及原核生物基因組測(cè)序數(shù)據(jù)研究
- 基因組變異仿真與基因組模式鑒定.pdf
- 無(wú)參考基因組的比較基因組學(xué)研究.pdf
- 基于核心基因的肺炎克雷伯菌基因組大數(shù)據(jù)的系統(tǒng)發(fā)育分析.pdf
- 壇紫菜基因組結(jié)構(gòu)特征及紅毛菜功能基因組特性分析.pdf
- 1型鴨肝炎病毒基因組測(cè)序及基因組結(jié)構(gòu)分析.pdf
- 臨床分離馬紅球菌基因組的結(jié)構(gòu)及比較基因組學(xué)分析.pdf
- 不同數(shù)據(jù)結(jié)構(gòu)下的基因組關(guān)聯(lián)分析.pdf
- 基于reads引導(dǎo)的基因組序列拼接.pdf
評(píng)論
0/150
提交評(píng)論