第四章--信息論與生物醫(yī)學1_第1頁
已閱讀1頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章 信息論與生物醫(yī)學,生命體本身是一個人復雜的信息傳遞、加工、處理和控制的系統(tǒng)。理論上,信息論與生物學和醫(yī)學有著密切的關(guān)系。1950年就有人把信息學引入生命研究中,但當時由于技術(shù)的限制,沒有引起人們的重視。近10-20年,人們對生命科學的研究達到細胞、亞細胞、分子和量子水平,尤其是在遺傳信息方面的研究取得重大成果,確立了信息理論在生物和醫(yī)學研究方面的作用和地位。本章簡單地討論信息論與生物和醫(yī)學的關(guān)系。,脫氧核糖核酸(DNA

2、 )分子是遺傳的物質(zhì)基礎(chǔ),遺傳信息存儲在DNA結(jié)構(gòu)中。DNA是雙螺旋結(jié)構(gòu),是由一系列核苷酸繞某一長中心軸形成的螺旋梯狀結(jié)構(gòu)。每個核苷酸所含的堿基不同。每個生命系統(tǒng)的DNA都是由四個堿基排列而成的堿基序列。不同堿基序列形成不同的DNA分子,形成不同放入生命機體。,4.1 DNA到蛋白質(zhì)的通訊系統(tǒng),從信息論的觀點看,DNA中的四種不同堿基相當于將遺傳信息編譯成密碼的四個字母,即遺傳信息源中的四個字母。,,不同字母排列成核苷酸系列。D

3、NA中的堿基序列長度非常長,故遺傳信息總共可能有的不同堿基序列總數(shù)是很大的。(幾萬個)再從生物學角度看,蛋白質(zhì)是生命的基本物質(zhì),它由20種不同的氨基酸以各種方式排列而成,而蛋白質(zhì)是安照DNA 傳遞出去的遺傳信息合成的。,問題:DNA分子中的堿基序列怎樣排列才能得到20種氨基酸合成的蛋白質(zhì)呢?要求:堿基集合的信息熵必須不小于氨基酸集合的信息熵。堿基:X表示,則H(X)=log4=2 bit氨基酸:Y表示,則H(Y)=log20=4

4、.32 bit顯然, H(X) H(Y),就滿足要求了。,人們提出了核苷酸三聯(lián)體的概念,即三個堿基編碼組成一個遺傳密碼?,F(xiàn)代科學實驗證明:現(xiàn)確認的三聯(lián)體共有64個(43=64),其中61個代表20種氨基酸的密碼,而其余三個代表終止密碼。下表顯示了該三聯(lián)體組合情況,其中用尿嘧啶(U)代替胸腺嘧啶(T)。,,過程 :DNA遺傳密碼由信使核糖核酸(mRNA)轉(zhuǎn)錄下來,然后由轉(zhuǎn)運核糖核酸(tRNA)把遺傳密碼轉(zhuǎn)譯成蛋白質(zhì)的氨基酸順序,合成

5、蛋白質(zhì)。中心法則: DNA→ mRNA → tRNA →蛋白質(zhì)將其看作是一個通訊系統(tǒng):輸入是DNA堿基序列,輸出是蛋白質(zhì)的氨基酸序列。稱之為DNA →蛋白質(zhì)的通訊系統(tǒng)。所有生命體都是由蛋白質(zhì)和核苷酸組成的,蛋白質(zhì)由20種氨基酸組成,核苷酸都包含堿基。由中心法則,整個通訊系統(tǒng)是嚴格不可逆的。通訊模型見下圖:,,首先研究輸入信源X3,是堿基信源X的三次擴展信源。X的符號集合A={A,G,C,U}。有研究表明,

6、堿基序列中的堿基并非統(tǒng)計獨立,它們之間是有依賴關(guān)系的,可以證實它們滿足一階馬爾科夫鏈。所以,信源X是一個一階馬爾科夫信源。(時齊和遍歷的),而 是一階馬爾科夫鏈的轉(zhuǎn)移概率,其轉(zhuǎn)移矩陣如下:,時齊遍歷的一階馬爾科夫鏈滿足:,信源X3是一階馬爾科夫信源X的三次擴展信源,所以X3也是一階馬爾科夫信源。X3的符號集其個數(shù)總共有64個。所以遺傳信道的輸入信源為,其次,觀察DNA→

7、蛋白質(zhì)的通訊信道,當遺傳信道為[X3,P(y|x1x2x3),Y],Y的符號集B={B1,B2,……,B21}共21個符合,20個代表20種不同的氨基酸, B21代表終止密碼。此信道是平穩(wěn)無記憶信道,信道的傳遞概率為P(y|x1x2x3)。如B1代表丙氨酸,則 P (B1|GUC)= P (B1|GCC)= P (B1|GCA)= P (B1|GCG)=1,其余的取值P(y|x1x2x3)=0。根據(jù)信道傳遞特性可求得輸出符號Y的

8、概率分布為:,所以信道容量:,信道的傳遞概率已知,就可以求出信道容量C。信道的最大信息傳輸率C=log21=4.392比特,但這要求氨基酸是統(tǒng)計獨立分布的,然而這種要求是不存在的。所以,上式C是對所有可能存在的情況求上界。,在生命的世代相傳中,絕大多數(shù)保持其遺傳特性,說明遺傳信息的傳遞是可靠準確的。但也存在變異(遺傳信息傳遞過程出錯引起的)。所以,DNA →蛋白質(zhì)的通訊系統(tǒng)不是完全理想的無噪信道(應該是有噪信道),將其看作兩個信道

9、串接而成:,由于變異引起的密碼到密碼的傳輸概率,仍表示密碼到氨基酸的對應關(guān)系,所以密碼到蛋白質(zhì)的信道為[X3,P*(y|x1x2x3),Y],其傳遞概率為:,此時蛋白質(zhì)Bj的概率為:,生命機體在遺傳信息傳遞的過程中有一定的抗干擾能力。從信息學角度看,增加信源的剩余度可以提高信道的抗干擾能力。所以,我們可以斷定DNA堿基序列不但存儲遺傳密碼,指導蛋白質(zhì)合成;而且還存儲較為復雜的“遺傳語言”,控制遺傳正確進行。即DNA的堿基序列是一種有

10、依賴的序列。,為了分析堿基序列的剩余度,Gatlin引進了兩個偏離指標:一階偏離指標D1,表示與等概率分布信源的偏離;二階偏離指標D2,表示與統(tǒng)計獨立分布信源的偏離;,實際堿基信源的熵,當堿基序列是一階馬爾科夫信源時,有,可得信源剩余度,D1+D2稱為信息密度,是信源最大熵與信源信息熵之間的差值;可以用它來衡量堿基序列的約束程度和“遺傳語言”的復雜程度。,實驗表明:脊椎動物的偏離指標D2一般高于低級生物的D2。而脊椎動物的“遺傳語言

11、”結(jié)構(gòu)有較高的剩余度時,主要是保持D1增加D2;相反低級動物主要是增加D1。所以,可以用D2作為區(qū)分脊椎動物和其他低級動物的生物體指標。故此,二階偏離指標也稱“進化指標”。,信息熵是系統(tǒng)紊亂程度的測度。如果一個系統(tǒng)很隨機、很混亂、無秩序,則此系統(tǒng)的信息熵就很大;反之,信息熵就很小。把信息熵引伸為描述事物集合中相互對立性質(zhì)的度量(無序與有序、隨機性與確定性、雜亂與規(guī)則等),可以把信息熵的概念用于醫(yī)學研究中。一個生命體,可以看做是由

12、相互聯(lián)系、相互作用的各個部分組成的復雜系統(tǒng);其任何一個部分都是以一定的組織性(有序性)和多樣性(復雜性)處于一定的穩(wěn)定狀態(tài),并且個部分之間相互作用、相互調(diào)節(jié),以保持系統(tǒng)穩(wěn)定。,4.2 醫(yī)學中的信息分析,任何系統(tǒng)都相應有一個描述它穩(wěn)定的多樣性與組織性的信息熵值。當系統(tǒng)或組織發(fā)生病變或異常時,系統(tǒng)的狀態(tài)將發(fā)生變化,信息熵將增加或減少,我們可以判斷系統(tǒng)的變化是趨于惡化,還是好轉(zhuǎn)??梢?,信息熵能對機體中系統(tǒng)狀態(tài)作出定量描述,所以信息熵的概念在

13、醫(yī)學研究中具有重要的作用。,根據(jù)以往的實驗數(shù)據(jù),可以對有機體中各組織、結(jié)構(gòu)或系統(tǒng)進行抽象,建立一個近似的信息概率模型。將有機體中各組織、結(jié)構(gòu)或系統(tǒng)抽象成一個完備的集合空間X,將有機體中各組織、結(jié)構(gòu)或系統(tǒng)中各組成部分看成為集合X的元素xi,而所占的百分比作為元素xi出現(xiàn)的概率p (xi)。抽象一個完備的概率空間:,可以用信息熵公式來表征這些組織、結(jié)構(gòu)和系統(tǒng)的有序性和組織性。,例如:臨床醫(yī)學研究水份在健康男子體內(nèi)的分布和在心臟病男子體內(nèi)

14、的分布情況。實驗數(shù)據(jù)見下表:,為了形成可供比較的概率空間的統(tǒng)計分布,我們將三種人體內(nèi)水的各自總含量設(shè)為1,求出不同組織內(nèi)水相對于總含量的百分比,結(jié)果見下表:,根據(jù)上表得三個概率空間模型,可以求出它們各自的信息熵值,形成下表:從上表看出,與健康人的水分布的熵相比,有心臟病的病人熵值增加,在浮腫的情況下熵值更高。,從醫(yī)學的觀點看,任何系統(tǒng)的生理狀態(tài)最惡化的情況,是系統(tǒng)最混亂、最無序、最不確定的情況,即系統(tǒng)的熵達到了極大值的狀態(tài)。因此,分

15、析一個信息體系的熵值變化所反映的疾病嚴重程度時,必須考慮熵值H與極大熵值Hmax之間的相對關(guān)系。引入相對熵和剩余度的概念,相對熵描述系統(tǒng)內(nèi)部的無序性、無組織性和不確定性的程度;剩余度反映系統(tǒng)現(xiàn)存的有序性或有組織性的程度。,利用機體中某些“信息系統(tǒng)”的信息指標(熵、相對熵、剩余度等),不僅可以對系統(tǒng)狀態(tài)變化方向作出定性的判斷,而且還能對系統(tǒng)狀態(tài)惡化的程度作出定量描述,這在臨床診斷與治療方面具有很重要的意義。注意!在處理實驗數(shù)據(jù)時,不能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論