面向概念漂移數(shù)據(jù)流的在線集成分類算法研究與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在過去的幾十年里,數(shù)據(jù)挖掘分類算法發(fā)展迅速,出現(xiàn)了許許多多性能較好的算法。然而,隨著大數(shù)據(jù)時代的到來,由于數(shù)據(jù)量的增大,數(shù)據(jù)的多樣性增加以及數(shù)據(jù)的產(chǎn)生速度加快,這些基于靜態(tài)數(shù)據(jù)挖掘的傳統(tǒng)分類算法已經(jīng)很難再保證良好的應(yīng)用可行性以及較高的分類準(zhǔn)確率。因此,針對大數(shù)據(jù)流,需要提出新的分類算法。本次研究所依賴的車聯(lián)網(wǎng)項目正是需要這類新的算法。
  本文的研究內(nèi)容是集成分類方法的改進(jìn)與應(yīng)用,主要包含三個方面的內(nèi)容。首先,本文將對現(xiàn)有兩類集成

2、方法進(jìn)行研究,歸納兩類集成方法為適應(yīng)動態(tài)數(shù)據(jù)流所做的努力,并基于這些研究提出改進(jìn)集成方法的通用策略。然后,基于第一項工作中所提出的改進(jìn)策略,本文還將對兩個典型的集成方法 AUE、OSBoost進(jìn)行改進(jìn)。AUE算法作為塊集成方法的代表,本次研究將主要考慮將它轉(zhuǎn)變?yōu)樵诰€方法。OSBoost作為在線方法的代表,本次研究將主要考慮提升該算法的準(zhǔn)確率。最后,本文還將研究如何把現(xiàn)有集成方法應(yīng)用到實踐中去。
  本文的主要成果如下:
  

3、1、基于現(xiàn)有算法,提出了三種改進(jìn)集成方法的通用策略。首先,使用增量式賦權(quán)機(jī)制能夠確保模型對最近最新的數(shù)據(jù)有較高的適應(yīng)能力。其次,使用自適應(yīng)分類器作為集成組件能夠大幅度提升集成方法對突變型概念漂移的適應(yīng)能力。最后,概念漂移檢測器的使用,使得集成方法能夠更精確的識別概念漂移并適應(yīng)概念漂移。實驗表明,這三種策略對集成方法的泛化準(zhǔn)確率具有不同程度的提升。
  2、基于上一結(jié)論,對兩種集成方法進(jìn)行了改進(jìn)。首先,針對塊集成方法AUE,本文通過

4、設(shè)計并對比四種改進(jìn)方案的結(jié)果,提出了在線集成算法OAUEAdwin。然后,針對在線方法 OSBoost算法,本文通過增加概念漂移檢測器并修改其賦權(quán)機(jī)制將其改進(jìn)為OSBoostAdwin算法。實驗結(jié)果表明,新的算法具有更高的泛化準(zhǔn)確率。同時,也再次證明了三種改進(jìn)策略的可行性。
  3、為了探索集成方法的應(yīng)用可行性,本次研究還基于VRSS平臺與MOA平臺整合出了實時數(shù)據(jù)流挖掘平臺 VRSS-MOA。基于 VRSS-MOA平臺,本文對比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論