

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、鼠疫耶爾森氏菌(Yersinia pestis)是一種能夠引起致命全身感染的高危細菌,世界上曾發(fā)生過三次鼠疫大流行,死亡人數(shù)過億。根據(jù)WHO的數(shù)據(jù),僅2001-2015年間,全球就發(fā)生18次鼠疫公共安全事件。中國目前已經(jīng)發(fā)現(xiàn)12塊典型的鼠疫自然疫源地,分布于15個省,占國土陸地總面積的15%。
自2001年Sanger實驗室發(fā)表第一株鼠疫菌CO92全基因組起,目前已有12株鼠疫菌的完成圖序列被公布,且都進行了基因組注釋工作。由
2、于高通量實驗技術(shù)的快速發(fā)展,鼠疫菌各方面研究工作產(chǎn)出了大量數(shù)據(jù),對其致病和傳播的理論認識也得到提高。因此重新審視基于過去知識的基因組注釋時發(fā)現(xiàn):原有信息存在諸多局限性甚至錯誤,而且這些錯誤信息會隨著以同源序列比對為基礎(chǔ)的注釋工作被不斷復制、放大、擴散。研究者曾使用比較基因組學、轉(zhuǎn)錄組和蛋白基因組學方法對個別鼠疫菌基因組進行了重注釋,但這些注釋側(cè)重于基因功能矯正和發(fā)現(xiàn)新基因等方面,數(shù)據(jù)內(nèi)容不夠全面。因此需要歸納、整合、完善已有鼠疫菌知識庫
3、,在過去基因組注釋結(jié)果基礎(chǔ)上,通過增加新的實驗數(shù)據(jù)、使用改進的算法對序列進行重新分析、修正可能存在的注釋錯誤,以進一步完善鼠疫菌基因組注釋結(jié)果,最終達到系統(tǒng)化加深鼠疫菌功能、生物行為和致病機理認識的目的。
數(shù)據(jù)共享是推動研究知識進步的重要方法。但除了大型公共數(shù)據(jù)庫外,僅有極少數(shù)原核模式生物(例如大腸桿菌)建立了組學數(shù)據(jù)庫。因此為了給研究者提供更加完整、準確、且易于查用的鼠疫菌注釋信息,有必要在收集整合鼠疫菌多種類型實驗數(shù)據(jù)和重
4、注釋結(jié)果基礎(chǔ)上,建立了針對該物種的跨組學數(shù)據(jù)庫系統(tǒng)。
本研究工作的主要數(shù)據(jù)來源包括:①基因組序列。NCBI提供的12株鼠疫菌的完成圖,它們是注釋的基礎(chǔ);②91001的蛋白組質(zhì)譜數(shù)據(jù)。質(zhì)譜結(jié)果是一種格式化、標準化的數(shù)據(jù),篩選后可以方便地使用,同時這類數(shù)據(jù)直接來源于實驗,數(shù)據(jù)質(zhì)量高;③RNA-seq數(shù)據(jù),來源于對91001菌株進行的RNA測序;④表達譜數(shù)據(jù)。來自91001基因芯片實驗,這些數(shù)據(jù)顯示基因在多種環(huán)境下的表達量,雖然暫時
5、難以在注釋中使用,但是可以為研究人員提供一個參考。此外,補充了文獻中發(fā)表的相關(guān)數(shù)據(jù)。
數(shù)據(jù)重注釋工作包括兩部分,第一部分是數(shù)據(jù)預處理。首先,結(jié)合多組學數(shù)據(jù)和生物信息軟件、數(shù)據(jù)庫,采用de novo從頭注釋的方法,共同完成重注釋工作。從基因預測開始,重新鑒定CDS區(qū),修正部分基因的起始位點;結(jié)合多個蛋白注釋數(shù)據(jù)庫,確定基因的功能;對于非基因區(qū),采用預測工具、數(shù)據(jù)庫和文獻注釋出 ncRNA;最后,在全基因組范圍,注釋出重復序列、移
6、動元件注釋工具等。第二部分是數(shù)據(jù)整理和分析。數(shù)據(jù)經(jīng)過分類、篩選,確定數(shù)據(jù)標準,進行標準化處理過程,完成后進行基因同源性分析、等位基因性分析等。整個過程需要對30多種軟件和數(shù)據(jù)庫進行本地化和使用。
跨組學數(shù)據(jù)庫是一個以若干組學數(shù)據(jù)庫表為基礎(chǔ)的數(shù)據(jù)庫,不同類型數(shù)據(jù)之間存在密切的相互聯(lián)系。構(gòu)建數(shù)據(jù)庫時采用信息系統(tǒng)的處理方法,結(jié)合鼠疫菌的生物學特點,確定研究目標后,從研究人員的需求出發(fā),首先進行需求分析,評估系統(tǒng)的可行性,了解功能和業(yè)
7、務需求,初步制定出數(shù)據(jù)標準,并構(gòu)建出數(shù)據(jù)模型;然后根據(jù)數(shù)據(jù)模型,進行組學數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計和功能設(shè)計;最終基于MySQL關(guān)系數(shù)據(jù)庫,使用Python Django框架進行web service系統(tǒng)的開發(fā)。
結(jié)合基因組、蛋白組、轉(zhuǎn)錄組等多組學數(shù)據(jù)和上述方法,本研究首先對鼠疫菌91001株進行了全面的重注釋:移除了137個不可靠的編碼區(qū);修正了41個基因起始位點、以及7個假基因和392個假想基因的功能;增加了ncRNA、重復序列、移
8、動元件等特殊基因組元件和基因組片段多樣性的注釋。通過對信息分析算法和軟件等的梳理整合,建立起可應用于其他鼠疫菌的半自動化重注釋工作流程;并進一步將該流程應用于其他11株鼠疫菌完成圖序列。最后,采用關(guān)系數(shù)據(jù)庫和web框架,構(gòu)建了基于互聯(lián)網(wǎng)絡(luò)的鼠疫菌跨組學數(shù)據(jù)庫系統(tǒng)——TODY分析平臺(http://tody.bmi.ac.cn/),方便研究者對重注釋數(shù)據(jù)進行查詢和使用。在等位基因多樣性處理和Web service服務系統(tǒng)實現(xiàn)的過程中,采用
9、了并行計算技術(shù)和分布式調(diào)度系統(tǒng),大大減少了計算時間,為下一步大規(guī)模數(shù)據(jù)分析和處理提供知識儲備和技術(shù)支持。
本工作融合了生物實驗、生物學知識、生物信息工具和計算機技術(shù),對明確鼠疫菌基因組的結(jié)構(gòu)和功能,揭示其更多的生物學特性具有重要意義。下一步我們將增加更多的相關(guān)文獻數(shù)據(jù)和實驗數(shù)據(jù),不斷豐富、充實鼠疫菌組學數(shù)據(jù)庫;通過實驗進行重注釋結(jié)果的準確性驗證;尋找合適的數(shù)據(jù)挖掘模型,進行深層次的數(shù)據(jù)分析,構(gòu)建出鼠疫菌知識庫;不斷完善web
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鼠疫耶爾森氏菌與假結(jié)核耶爾森氏菌比較基因組學研究.pdf
- 鼠疫耶爾森氏菌pYC質(zhì)粒的全基因組初步分析.pdf
- 鼠疫耶爾森氏菌噬菌體Yep-phi基因組研究及其受體鑒定.pdf
- 鼠疫耶爾森氏菌布氏田鼠疫源地菌株91001全基因組序列測定及初步分析.pdf
- 鼠疫耶爾森氏菌基因組多態(tài)性研究及快速鑒定溯源系統(tǒng)的建立.pdf
- 耶爾森氏菌91001株基因組測序、比較基因組學及Ⅲ型分泌系統(tǒng)研究.pdf
- 鼠疫耶爾森氏菌知識庫的建立.pdf
- 鼠疫耶爾森氏菌密度感應系統(tǒng)研究.pdf
- 鼠疫耶爾森菌課件
- 鼠疫耶爾森氏菌新型候選DNA疫苗的構(gòu)建及其免疫效果鑒定.pdf
- 基于DNA芯片技術(shù)鼠疫耶爾森氏菌在不同條件下的轉(zhuǎn)錄組學研究.pdf
- 環(huán)境因素調(diào)控鼠疫耶爾森氏菌基因表達的比較轉(zhuǎn)錄譜學研究.pdf
- 鼠疫耶爾森氏菌Pla蛋白的提取與純化.pdf
- 鼠疫耶爾森氏菌密度感應系統(tǒng)與毒力關(guān)系研究.pdf
- 鼠疫耶爾森氏菌基因表達譜技術(shù)平臺的建立與應用.pdf
- 基因組島數(shù)據(jù)庫及分析平臺構(gòu)建.pdf
- cAMP受體蛋白調(diào)控鼠疫耶爾森氏菌毒力的研究.pdf
- 人類基因組結(jié)構(gòu)注釋數(shù)據(jù)庫構(gòu)建及數(shù)據(jù)可視化展示.pdf
- 鼠疫耶爾森氏菌降解其分泌的鼠毒素研究.pdf
- 鼠疫耶爾森氏菌LcrV突變體的初步研究.pdf
評論
0/150
提交評論