

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘中的一個重要模型是分類模型,傳統(tǒng)數(shù)據(jù)挖掘方法的目標(biāo)是獲得一個分類精度盡可能高的分類器。但是在實(shí)際問題中,外部環(huán)境的各種不確定因素會導(dǎo)致決策不能順利達(dá)到預(yù)期目標(biāo),進(jìn)而帶來決策風(fēng)險代價,且分類模型中的誤分類代價不盡相同,存在代價敏感性。完全避免決策失誤是難以做到的,人們所期望的是使決策風(fēng)險代價最小,而非期望利益最大化。追求決策知識與經(jīng)驗(yàn)數(shù)據(jù)的嚴(yán)格一致性容易給決策者提供錯誤的決策信息,且忽略了決策者對預(yù)期風(fēng)險的規(guī)避心理,已不適用于解決
2、實(shí)際問題。三支決策將決策視為分類問題,與數(shù)據(jù)挖掘處理的問題模型相一致,建立了決策理論與數(shù)據(jù)挖掘方法之間的橋梁,其具有的誤差容忍與代價敏感機(jī)制可以使傳統(tǒng)的數(shù)據(jù)挖掘方法在分類中對不同代價的誤分類結(jié)果具有區(qū)分性與敏感性,以做出風(fēng)險損失最低的分類結(jié)果。
針對一般的數(shù)據(jù)挖掘模型僅僅尋求分類器的精度,不能根據(jù)人們的期望處理現(xiàn)實(shí)中的決策問題,本文將三支決策用于傳統(tǒng)的數(shù)據(jù)挖掘方法中,構(gòu)建了基于三支決策的代價敏感學(xué)習(xí)方法,使傳統(tǒng)的數(shù)據(jù)挖掘方法更
3、好地適應(yīng)具有代價敏感性的實(shí)際問題。本文主要研究內(nèi)容如下:
(1)針對典型的支持向量機(jī)增量學(xué)習(xí)算法對有價值的非支持向量的忽略,以及一般的支持向量機(jī)增量學(xué)習(xí)算法盡可能提升分類精度的客觀性,利用三支決策的代價敏感性和邊界域構(gòu)建了一種新的支持向量機(jī)增量學(xué)習(xí)算法。該算法首先根據(jù)支持向量機(jī)的學(xué)習(xí)原理來度量三支決策中的條件概率;然后采用三支決策劃分出邊界域,并基于支持向量機(jī)對其與新增樣本、原支持向量的并集進(jìn)行分類;最后,通過實(shí)驗(yàn)證明,該方法
4、不僅能夠篩選出有價值的非支持向量進(jìn)而提高分類的精確性,而且使支持向量機(jī)增量學(xué)習(xí)方法更適合于具有代價敏感性的實(shí)際問題,并使三支決策中條件概率的構(gòu)建方式更切合于具體學(xué)習(xí)環(huán)境。
(2)針對現(xiàn)有的涉及k近鄰的top-n離群點(diǎn)檢測算法通常依賴于參數(shù)k,n,但用戶卻很難確定合適的參數(shù)值,基于三支決策的三支語義提出了一種基于三支決策的代價敏感離群點(diǎn)檢測方法。該方法首先采用k近鄰來度量三支決策的條件概率;其次,構(gòu)建使決策代價最小的最優(yōu)化問題來
5、自適應(yīng)地尋找最優(yōu)條件概率;然后,采用三支決策遞歸地劃分離群點(diǎn);最后,通過實(shí)驗(yàn)證明,該方法不僅使條件概率的度量方法適用于離群點(diǎn)檢測問題,而且可以在不需要用戶參與的前提下自動地檢測離群點(diǎn)。
(3)針對傳統(tǒng)數(shù)據(jù)挖掘方法對不一致數(shù)據(jù)的忽視,以及一般的決策樹算法對不一致結(jié)點(diǎn)的處理缺乏理論支撐的缺陷,根據(jù)三支決策的代價敏感性和邊界域構(gòu)建了一種新的決策樹分類方法。該方法首先采用決策樹結(jié)點(diǎn)的正例比例來度量三支決策中的條件概率,進(jìn)而三支劃分決策
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 代價敏感的三支決策邊界域處理模型研究.pdf
- 改進(jìn)代價敏感的決策樹學(xué)習(xí)方法研究.pdf
- 自適應(yīng)代價敏感決策樹的學(xué)習(xí)方法.pdf
- 基于三支決策的重疊聚類方法研究.pdf
- 基于粗糙集的代價區(qū)間與多人三支決策的研究.pdf
- 混合型數(shù)據(jù)的代價敏感學(xué)習(xí)方法.pdf
- 基于測度論的三支決策理論研究.pdf
- 代價敏感決策樹構(gòu)建方法的研究.pdf
- 基于三支決策的中文微博觀點(diǎn)句識別研究.pdf
- 基于決策粗糙集模型的多類代價敏感學(xué)習(xí)研究.pdf
- 基于構(gòu)造性覆蓋算法的三支決策模型.pdf
- 三支決策邏輯基礎(chǔ)及模型研究.pdf
- 基于概率圖的三支決策模型及其應(yīng)用研究.pdf
- 合成集值決策表與三支決策.pdf
- 基于動態(tài)代價敏感的機(jī)器學(xué)習(xí)研究.pdf
- 基于代價敏感學(xué)習(xí)的維數(shù)約簡方法及其應(yīng)用研究.pdf
- 基于LGC算法的代價敏感分類方法研究.pdf
- 代價敏感決策樹算法研究.pdf
- 基于云計算平臺的代價敏感集成學(xué)習(xí)研究.pdf
- 帕金森語音特征提取軟件開發(fā)及三支決策診斷方法研究.pdf
評論
0/150
提交評論