基于GEP函數(shù)發(fā)現(xiàn)的智能模型庫關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩114頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計算機技術廣泛而深入的應用對決策支持提出了更高的要求。智能決策支持系統(tǒng)(Intelligent Decision Support Systems,IDSS)應運而生。 模型庫子系統(tǒng)是決策支持系統(tǒng)的核心。但傳統(tǒng)模型庫的建立方法存在以下缺點: (1)需預先確定好模型庫中模型的類型,DSS只能根據(jù)樣本數(shù)據(jù)對現(xiàn)有的模型進行有關參數(shù)計算,進而讓決策者根據(jù)結果來進行預測。這種模型庫缺少了真正意義上的智能尋找模型類型的功能。

2、(2)可能依賴領域的專家經(jīng)驗。如專家系統(tǒng)需要一個內容豐富而全面的知識庫支撐,依靠的是某領域的專家經(jīng)驗,因此,該智能模型庫對先驗知識依賴性很強,難以實現(xiàn)真正意義上的智能化。 (3)在預先不知模型類型時,需憑經(jīng)驗確定模型類型,含有主觀和盲目因素。 (4)傳統(tǒng)方法目前不能支持復雜函數(shù)關系式和多分段函數(shù)關系式等模型的建立。 (5)擴展性較差。針對不同的函數(shù)模型類型,在程序實現(xiàn)時就必須有一個新的程序模塊。當模型庫要進行擴充

3、,系統(tǒng)就要為該模型增加新的代碼。 為了解決以上問題,本文將基因表達式編程(Gene Expression Programming,GEP)技術引入智能模型庫的研究中。 基因表達式編程具有極強的函數(shù)發(fā)現(xiàn)能力和很高的效率,并且在函數(shù)發(fā)現(xiàn)時不需要任何先驗知識,無需預存函數(shù)模型的類型,避免了傳統(tǒng)算法建模時事先選定函數(shù)類型的盲目性。 基因表達式編程研究領域尚有許多空白點,如GEP的理論分析、基于GEP屬性約簡的函數(shù)挖掘、基

4、于殘差分布適應度GEP方法等等。本文的工作是基于這些空白點展開,并將GEP這種新技術引入到DSS。 本文主要貢獻如下: (1)提出并實現(xiàn)了兩種數(shù)據(jù)預處理方法: i.復共線性數(shù)據(jù)的預處理算法ε-MDPA(ε-Multicollinearity Data Preprocessing Algorithm),該方法是針對在函數(shù)發(fā)現(xiàn)中要處理的數(shù)據(jù)具有復共線性時數(shù)據(jù)的預處理辦法 ii.基于Hash函數(shù)取樣的數(shù)據(jù)預處理

5、算法HSDPA(Hash Sampling Based Data Preprocessing Algorithm),其中的取樣是在總體數(shù)據(jù)太龐大時,為了提高函數(shù)發(fā)現(xiàn)的效率和樣本質量,所采取的抽樣技術。 (2)針對GEP理論的不足或空白點,對GEP的基本概念進行了一系列的形式化描述。利用馬爾可夫鏈理論,對群體為離散型的GEP進行了收斂性分析,證明了GEP的馬爾可夫鏈收斂性定理。針對群體為一般型的GEP,分析了適應度函數(shù)的收斂性,并

6、證明了最小殘差平方和依概率收斂定理。在理論上保證了GEP方法的可靠性和可行性。 (3)提出了顯式模型概念和基于GEP的顯式模型挖掘算法(GEP-Explicit Model Mining Algorithm, GEP-EIMA),新方法兼容了傳統(tǒng)函數(shù)發(fā)現(xiàn)算法顯式模型的挖掘,實現(xiàn)了系統(tǒng)的易擴展性。同時,通過實驗驗證了算法的有效性。 (4)根據(jù)GEP函數(shù)發(fā)現(xiàn)依概率收斂定理,提出了基于GEP的殘差制導進化算法(GEP-RGEA

7、),提高了GEP算法的效率。并通過3個實驗與GP以及其它預測方法進行了對比性實驗。實驗結果表明,在噪聲數(shù)據(jù)很小的情況下,三種算法均挖掘出目標函數(shù),但GEP比GP的收斂速度提高了20倍,RGEA比GP提高了60倍。對于函數(shù)類型未知且極為復雜的數(shù)據(jù),GEP和RGEA在發(fā)現(xiàn)理想函數(shù)的速度上要比GP分別快900、1800倍。 (5)提出了邊際基因、邊際適應度、殘差分布適應度概念以及基于邊際適應度和殘差分布適應度的GEP算法(GEP-MF

8、RDF),算法保證了殘差服從近似正態(tài)分布,克服了傳統(tǒng)GEP算法一味追求殘差絕對值小,忽略殘差應滿足正態(tài)分布的要求,有可能導致系統(tǒng)誤差的不足。提出了基于GEP的貪婪式屬性約簡函數(shù)挖掘算法(GEP BasedGreedy Attribute Reduction Function Mining Algorithm, GEP-GARFMA)和基于GEP的逐步屬性約簡函數(shù)挖掘算法(GEPBased Stepwise Attribute Reduc

9、tion Function Mining Algorithm,GEP-SARFMA),使系統(tǒng)能在自變量很多情況下自動實現(xiàn)屬性約簡的函數(shù)挖掘功能。通過兩個實驗驗證了算法的有效性。實驗表明:(a)GEP-GARFMA和GEP-SARFMA在發(fā)現(xiàn)最優(yōu)函數(shù)表達式時,均能有效地進行屬性約簡;(b GEP-SARFMA發(fā)現(xiàn)的函數(shù)表達式精度與GEP-GARFMA方法差不多;(c)當自變量個數(shù)為20時,GEP-SARFMA方法比GEP-GARFMA快3

10、00倍;(d)使用GEP-SARFMA挖掘的函數(shù)模型的適應度函數(shù)值比傳統(tǒng)方法提高24.6%。 (6)提出并實現(xiàn)了基于GEP函數(shù)發(fā)現(xiàn)的智能模型庫系統(tǒng)(GEP BasedIntelligent Model Base System, GEP-IMBS),給出了GEP-IMBS系統(tǒng)與GIS、DSS等接口技術。該系統(tǒng)是真正意義的無先驗知識的智能模型庫系統(tǒng),模型的類型和參數(shù)的求解均由程序自己來實現(xiàn)。通過一個真實數(shù)據(jù)實驗驗證GEP-IMBS系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論