版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、自人類基因組計劃(HGP)開展以來,人們已經(jīng)獲取了大量的DNA、RNA及蛋白質(zhì)序列的數(shù)據(jù).有人說,基于序列的生物學(xué)時代已經(jīng)到來,盡管對"序列生物學(xué)"這一提法可能有所爭議,但是今日像潮水般涌現(xiàn)的序列信息卻是無可爭辯的事實.截至目前,登錄在GeneBank數(shù)據(jù)庫中的DNA序列總量已經(jīng)超過73億堿基.生物學(xué)數(shù)據(jù)的積累并不僅僅表現(xiàn)在DNA序列方面,與其同步的還有蛋白質(zhì)一級結(jié)構(gòu),即氨基酸序列的增長.目前已有18個生物體的完整基因組被破譯,已有89
2、00多種蛋白質(zhì)和其他生物分子的空間結(jié)構(gòu)被闡明,這些都構(gòu)成了生物信息的重要組成部分.數(shù)據(jù)并不等于信息和知識,但卻是信息利知識的源泉,關(guān)鍵在于如何從中挖掘它們.與正在以指數(shù)方式增長的生物學(xué)數(shù)據(jù)相比,人類相關(guān)知識的增長(粗略地用每年發(fā)表的生物、醫(yī)學(xué)論文數(shù)來代表)卻十分緩慢.一方面是巨量的數(shù)據(jù);另一方面是我們在醫(yī)學(xué)、藥物、農(nóng)業(yè)和環(huán)保等方面對新知識的渴求,這些新知識將幫助人們改善其生存環(huán)境和提高生活質(zhì)量.這就構(gòu)成了一個極大的矛盾.這個矛盾就催生了
3、一門新興的交叉科學(xué),這就是生物信息學(xué).生物信息學(xué)是一門新興的邊緣交叉學(xué)科,是近年來國際上的研究熱點.生物信息學(xué)是利用信息技術(shù)來理解生物問題的一種手段,是探索生命奧妙,擴展生物醫(yī)學(xué)行為數(shù)據(jù)使用的一種方法,是通過計算方法將生物信息轉(zhuǎn)化為知識的工具.它是一門利用信息來理解生命活動的科學(xué),它綜合利用了生物學(xué)、計算機科學(xué)與技術(shù)、數(shù)學(xué)等學(xué)科的優(yōu)勢,借以探索現(xiàn)有的海量生物學(xué)數(shù)據(jù)中蘊含的生物學(xué)意義.人們獲得各種核酸和蛋白質(zhì)序列的目的是了解這個序列在生物
4、體中充當(dāng)了怎樣的角色.該文的工作主要分為針對核酸序列的預(yù)測和針對氨基酸序列的預(yù)測兩部分.剪切點和啟動區(qū)域的預(yù)測主要是基于基因序列的預(yù)測.GPCRs超家族的識別和蛋白質(zhì)二級結(jié)構(gòu)含量的分類預(yù)測則以氨基酸序列作為研究的數(shù)據(jù)來源.G蛋白偶聯(lián)受體(G Protein Coupled Receptors,GPCRs)是體內(nèi)最大的蛋白質(zhì)超家族,許多疾病與之密切相關(guān),GPCRs因此成為藥物治療的重要靶標(biāo).然而,大多數(shù)GPCRs三級結(jié)構(gòu)仍然是未知的.隨著
5、人類基因組以及其它種類生物基因組的開展,大量的GPCRs的一級結(jié)構(gòu)信息即氨基酸序列的數(shù)據(jù)已經(jīng)獲得.在缺乏實驗數(shù)據(jù)的情況下,通??梢岳糜嬎惴椒▽π掳l(fā)現(xiàn)的受體進行識別,給出它們可能隸屬的類別,從而發(fā)現(xiàn)其潛在的功能.比如:如果發(fā)現(xiàn)一個新的受體序列與現(xiàn)有的某蛋白質(zhì)家族有很大的相似性,我們就可以在一定程度上推測該受體可能具有該類蛋白質(zhì)家族的一些特征和功能.針對這個問題,該文采用了一種隱馬爾可夫模型的方法,利用GPCRs一級結(jié)構(gòu)信息和數(shù)據(jù)自身特性
6、,在GPCRs超家族層次各類別之間進行識別,具體考慮了ACDE與B類超家族,以及BCDE與A類超家族的分辨,取得了不錯的效果,類之間的識別準(zhǔn)確率可以達到100%.研究過程中,我們考慮了生物統(tǒng)計過程中常見的不等長變量問題.通過與常規(guī)的等變量截取效果的對比,我們也證明了HMM用于不等長的同源蛋白序列分類的預(yù)測是非常合適的.除了對GPCRS超家族的分類研究之外,我們還嘗試將HMM用于真核生物的剪切點和初始轉(zhuǎn)錄位點(TSS)的識別.用HMM對真
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于隱馬爾可夫模型的G蛋白偶聯(lián)受體預(yù)測的研究.pdf
- 語音識別中隱馬爾可夫模型的研究.pdf
- 基于隱馬爾可夫模型的手指靜脈識別研究.pdf
- 基于隱馬爾可夫模型的EST序列聚類研究.pdf
- 基于隱馬爾可夫模型的多序列比對算法.pdf
- 基于隱馬爾可夫模型的人臉識別研究.pdf
- 基于隱馬爾可夫模型的自動和弦識別.pdf
- 基于隱馬爾可夫模型的步態(tài)識別算法研究.pdf
- 隱馬爾可夫模型簡介
- 隱馬爾可夫模型下基于通信流的隱組織識別.pdf
- 基于隱馬爾可夫模型的協(xié)議識別技術(shù)的研究.pdf
- 隱馬爾可夫模型技術(shù)
- 隱馬爾可夫模型系統(tǒng)調(diào)用序列異常檢測研究.pdf
- 基于隱馬爾可夫模型的時間序列聚類的研究.pdf
- 基于隱馬爾可夫模型的語音識別技術(shù)研究.pdf
- 41351.基于隱馬爾可夫模型的并行多重序列比對
- 基于隱馬爾可夫模型的語音識別方法的研究.pdf
- 基于隱馬爾可夫模型的人臉識別技術(shù)研究.pdf
- 基于隱馬爾可夫模型的J波識別技術(shù)研究.pdf
- 空間統(tǒng)計中的隱馬爾可夫模型.pdf
評論
0/150
提交評論