版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、人工智能的發(fā)展對科技和經(jīng)濟的發(fā)展起了重大的推動作用。尤其在解決復雜優(yōu)化、減少反應(yīng)時間和促進產(chǎn)品的開發(fā)等方面表現(xiàn)更為突出。隨著科技的進步,大量數(shù)據(jù)的產(chǎn)生需要有效的方法才能得出更加可行的結(jié)果,有利于促進科技的快速發(fā)展。因此研究新的高效數(shù)據(jù)挖掘方法和尋找規(guī)律已成為人工智能研究的迫切需要。 本文對一種新的數(shù)據(jù)挖掘方法:基因表達式編程(geneexpressionprogramming,GEP)進行研究,GEP是一種新的機器學習算法,具有
2、優(yōu)異的泛化能力,是由FerreiraC.于1999年根據(jù)遺傳算法和遺傳程序發(fā)展而來的。本論文主要對GEP的原理和在定量結(jié)構(gòu)—性質(zhì)/活性關(guān)系(QSPR/QSAR)和疾病診斷方面的進行了應(yīng)用研究。 第一章:對GEP算法原理、實現(xiàn)步驟以及研究現(xiàn)狀進行了詳細的綜述,并對GEP和支持向量機(supportvectormachines,SVM)在疾病診斷和QSAR中的應(yīng)用現(xiàn)狀進行了綜述。 第二章:應(yīng)用GEP和SVM方法對疾病的診斷和
3、發(fā)病率進行預(yù)測,包括:(1)用SVM方法對346例(冠心病172例,健康體檢174例)進行了分類判別,同時用線性判別分析方法(lineardiscriminantanalysis,LDA)作為對照研究,對訓練集的預(yù)測準確率分別是96.86%和78.18%,測試組的預(yù)測準確率分別是90.57%和72.73%;(2)用SVM和LDA算法對70例(腎病綜合征50例,腎小球腎炎20例)進行了診斷,訓練集的預(yù)測準確率分別是94.6%和89.86%
4、,測試組的預(yù)測準確率分別是78.18%和72.73%。表明用SVM方法建立的模型其預(yù)測能力要優(yōu)于LDA;(3)用GEP方法對2003年我國SARS的高發(fā)地區(qū)北京市和山西省的發(fā)病趨勢進行建模預(yù)測,其擬合情況與當時SRAS實際發(fā)病和死亡情況基本一致,實驗結(jié)果表明其在精度和速度上都優(yōu)于神經(jīng)網(wǎng)絡(luò)算法。 第三章:GEP和SVM方法在藥物性質(zhì)方面的應(yīng)用研究:(1)應(yīng)用啟發(fā)式方法(HM)和支持向量機方法建立了70種藥物與血漿蛋白結(jié)合率的定量構(gòu)
5、效關(guān)系模型,研究了分子結(jié)構(gòu)對藥物與血漿蛋白結(jié)合率的影響。兩種方法均得到了較好的結(jié)果,交互檢驗的相關(guān)系數(shù)平方(R2)分別為0.80和0.82;通過對模型的穩(wěn)定性和預(yù)測能力比較表明,支持向量機建立的QSAR模型能夠更好地預(yù)測藥物與血漿蛋白結(jié)合率;(2)應(yīng)用GEP方法建立了抗艾滋病藥物核苷類的定量構(gòu)效關(guān)系模型,研究了分子結(jié)構(gòu)對此類藥物EC50的影響。用HM方法篩選5個描述符建立模型,平均誤差是0.41,而模型的相關(guān)系數(shù)(R)是091,對GEP
6、和SVM方法建立的模型進行了比較,GEP建立的模型中訓練集和測試集的相關(guān)系數(shù)分別是0.91和0.63,而SVM方法建立的模型中訓練集和測試集的相關(guān)系數(shù)分別是0.86和052,不論是測試集還是訓練集的預(yù)測結(jié)果,GEP都優(yōu)于SVM,因此GEP可以作為一種有效的手段預(yù)測核苷類的抗艾滋病藥物的EC50;(3)基于GEP方法建立1,4-二氫吡啶鈣離子通道拮抗劑的半數(shù)有效抑制濃度(IC50),用啟發(fā)式方法篩選6個相關(guān)描述符,用GEP建立QSAR模型
7、,得到了很好的預(yù)測結(jié)果,均方誤差(MSE)是0.19,R2是0.92,本文為藥物篩選和設(shè)計提供了一種新而有效的方法。 第四章:GEP和SVM方法在分析化學方面的研究應(yīng)用:(1)建立了基于啟發(fā)式方法和支持向量機方法的QSAR模型,用于預(yù)測α-環(huán)糊精與單取代或1,4-二取代苯衍生物結(jié)合后包結(jié)物的穩(wěn)定常數(shù)。通過計算并用HM篩選6個參數(shù),用于啟發(fā)式方法和支持向量機方法建立QSAR模型,其R值分別是094和0.98,留一法(leave-o
8、ne-out,LOO)交互檢驗的相關(guān)系數(shù)(RCV)分別為0.92和0.95。因此,用支持向量機方法建立的模型要優(yōu)于啟發(fā)式方法,其預(yù)測能力更強,模型的穩(wěn)定性更好;(2)應(yīng)用啟發(fā)式方法和支持向量機方法建立了88種醛類化合物對大鼠急性毒性的定量構(gòu)效關(guān)系模型,研究了醛類化合物分子結(jié)構(gòu)對大鼠急性毒性的影響。兩種方法均得到了較好的結(jié)果,啟發(fā)式方法和支持向量機方法的交互檢驗的相關(guān)系數(shù)分別為0.90和0.93;通過對模型的穩(wěn)定性和預(yù)測能力比較,支持向量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于支持向量機方法的QSAR-QSPR在化學、生物及環(huán)境科學中的應(yīng)用研究.pdf
- 基因表達式編程在電力負荷預(yù)測中的應(yīng)用研究.pdf
- 線性和非線性方法在QSAR-QSPR研究中的應(yīng)用.pdf
- 基因表達式編程在股票預(yù)測中的應(yīng)用與研究.pdf
- 基因表達式編程算法及其應(yīng)用研究.pdf
- 基因表達式編程在演化建模中的應(yīng)用研究.pdf
- 改進基因表達式編程在地鐵變形預(yù)測中的應(yīng)用研究.pdf
- 基因表達式編程算法的研究與應(yīng)用.pdf
- 基因表達式編程在軟件可靠性建模中的應(yīng)用研究.pdf
- 基因表達式編程的改進及其在知識發(fā)現(xiàn)中的應(yīng)用研究.pdf
- 基因表達式編程在電力負荷預(yù)測中的應(yīng)用.pdf
- 基因表達式編程研究及其在函數(shù)挖掘中的應(yīng)用.pdf
- 改進基因表達式編程在深基坑變形預(yù)測中的應(yīng)用研究.pdf
- 多表達式編程在規(guī)則挖掘中的應(yīng)用研究.pdf
- 改進基因表達式編程在礦山地表變形預(yù)測中的應(yīng)用研究.pdf
- 基因表達式編程在重金屬形態(tài)預(yù)測建模中的應(yīng)用研究.pdf
- 改進的基因表達式編程算法在負荷建模中的應(yīng)用.pdf
- 30861.基因表達式編程在gps高程擬合中的應(yīng)用
- 基于免疫策略的基因表達式編程在函數(shù)挖掘中的應(yīng)用.pdf
- 基因表達式編程技術(shù)及其在車間調(diào)度中的應(yīng)用研究.pdf
評論
0/150
提交評論