仿生計(jì)算在生物信息學(xué)中的應(yīng)用.pdf_第1頁(yè)
已閱讀1頁(yè),還剩126頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在過(guò)去的幾年間,計(jì)算機(jī)仿生計(jì)算在生命科學(xué)和醫(yī)學(xué)的各個(gè)領(lǐng)域愈來(lái)愈起著前所未有的重要作用。計(jì)算機(jī)在序列分析中的應(yīng)用,掀起了生物信息學(xué)的第一個(gè)高潮,但這個(gè)方面至今還有許多重要的問(wèn)題尚未解決,其中的一個(gè)重要原因是計(jì)算的速度和效率還不能滿(mǎn)足數(shù)據(jù)處理的需要。 隨著基因組和其它測(cè)序項(xiàng)目的不斷進(jìn)展,研究的重點(diǎn)正逐步從積累數(shù)據(jù)轉(zhuǎn)移到如何來(lái)解釋這些數(shù)據(jù)。生物學(xué)的新發(fā)現(xiàn)將極大地依賴(lài)我們?cè)诙鄠€(gè)維度和不同尺度下對(duì)多樣化數(shù)據(jù)進(jìn)行組合和關(guān)聯(lián)的分析能力。

2、 在數(shù)據(jù)量呈幾何級(jí)數(shù)增長(zhǎng)的情況下,生物信息的存儲(chǔ)、獲取、聯(lián)網(wǎng)、處理和瀏覽以及可視化等方面,都對(duì)理論、算法和軟件的發(fā)展提出了迫切的需求。 計(jì)算機(jī)科學(xué)也從生命系統(tǒng)中獲得啟示,通過(guò)對(duì)生命活動(dòng)的分析和模仿,產(chǎn)生了許多新的概念,包括:遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)病毒和人造免疫系統(tǒng)、DNA計(jì)算、人工生命。這樣的學(xué)科交叉豐富了各個(gè)相關(guān)領(lǐng)域,將在未來(lái)的歲月中得到進(jìn)一步的發(fā)展。 在本文中,結(jié)合生物信息學(xué)中的應(yīng)用,我們使用了基于生物啟發(fā)

3、的仿生計(jì)算方法,如遺傳算法,覆蓋算法,蟻群算法等。這些構(gòu)成了一個(gè)有趣的循環(huán),從生命中來(lái),到生命中去,這是本論文的研究特色和中心任務(wù)。 在本文中,我們以分子生物學(xué)的核心定律——中心法則為框架,簡(jiǎn)要介紹了生物信息學(xué)研究所牽涉到的生物學(xué)概念,對(duì)生物信息學(xué)的研究?jī)?nèi)容、研究方法作了概要的介紹。著重研究了生物信息學(xué)的一個(gè)重要研究對(duì)象蛋白質(zhì)的性質(zhì)和特點(diǎn),以及蛋白質(zhì)研究的結(jié)構(gòu)分類(lèi)方法;介紹了蛋白質(zhì)結(jié)構(gòu)研究的現(xiàn)狀,綜合研究和分析了蛋白質(zhì)研究中所采

4、用的各種方法的技術(shù)特點(diǎn)。同時(shí)對(duì)微陣列基因芯片的原理和作用給予扼要的介紹。 本文具體分析了人工神經(jīng)網(wǎng)絡(luò)中的一種——FP神經(jīng)網(wǎng)絡(luò)的覆蓋算法,討論了它的原理、特性,并提出了一種貪婪覆蓋算法,通過(guò)加州大學(xué)爾灣分校(UCI)所提供的機(jī)器學(xué)習(xí)數(shù)據(jù)集進(jìn)行測(cè)試,驗(yàn)證了其有效性,并把它具體應(yīng)用于蛋白質(zhì)二級(jí)結(jié)構(gòu)的劃分和基于基因芯片的疾病分類(lèi)。 蛋白質(zhì)二級(jí)結(jié)構(gòu)是蛋白質(zhì)分析的重要一環(huán),是對(duì)更高級(jí)蛋白質(zhì)結(jié)構(gòu)進(jìn)行分析的基礎(chǔ)研究。對(duì)蛋白質(zhì)二級(jí)結(jié)構(gòu),我

5、們對(duì)它的序列編碼作了仔細(xì)的研究,比較了各種編碼方法的特點(diǎn),采用了一種包含遺傳信息特點(diǎn)的profile編碼方法。在此基礎(chǔ)上,針對(duì)該問(wèn)題的特點(diǎn),用覆蓋算法進(jìn)行了分類(lèi)的研究。 微陣列是基因分析和疾病診斷的一個(gè)重要分析工具,它具有數(shù)據(jù)量大而復(fù)雜的特點(diǎn)。我們對(duì)數(shù)據(jù)的特征進(jìn)行了研究,先采用t統(tǒng)計(jì)法,剔除其中無(wú)用的數(shù)據(jù),然后用覆蓋算法進(jìn)行分類(lèi),并與采用其它技術(shù)的分類(lèi)方法對(duì)結(jié)果作了比較分析。 遺傳算法是一種使用廣泛,具有很強(qiáng)適應(yīng)性的算法

6、,尤其適應(yīng)于可用序列表示的問(wèn)題的優(yōu)化。而我們的研究對(duì)象蛋白質(zhì)正好是由氨基酸組成的序列,我們提出了一種具有二維變異算子和附加操作的遺傳算法應(yīng)用于蛋白質(zhì)結(jié)構(gòu)的二維HP模型分析,根據(jù)二維HP折疊模型的特點(diǎn),采用了便于保持蛋白質(zhì)優(yōu)良折疊結(jié)構(gòu)的局部(相對(duì))坐標(biāo)表示方法,設(shè)計(jì)了適合于此模型的變異算子,給出了求解優(yōu)化結(jié)構(gòu)的方法和步驟,分析了所得結(jié)果的特點(diǎn)。 另一種生物啟發(fā)的算法——蟻群算法,是近年來(lái)一個(gè)熱門(mén)的研究領(lǐng)域,它在諸如TSP(旅行商)

7、問(wèn)題、網(wǎng)絡(luò)路由等領(lǐng)域已經(jīng)獲得了滿(mǎn)意的結(jié)果。我們給出了使用它來(lái)獲取三維蛋白質(zhì)簡(jiǎn)化模型優(yōu)化結(jié)構(gòu)的思路和構(gòu)建方法,提出了基于矩陣的快速坐標(biāo)系統(tǒng)的“右手法則”轉(zhuǎn)換方法,減少了計(jì)算的時(shí)間,為提高優(yōu)化速度,防止過(guò)早收斂,給出了三種局部搜索的辦法;針對(duì)蛋白質(zhì)折疊過(guò)程中容易出現(xiàn)死鎖的問(wèn)題,提出了一種解決自回避無(wú)效構(gòu)像的方法,并對(duì)三維折疊時(shí)的一些特有情況進(jìn)行了細(xì)致的分析,設(shè)計(jì)了能減少計(jì)算規(guī)模的一些措施。綜合這些步驟,對(duì)三維HP折疊進(jìn)行了優(yōu)化,取得了較好的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論