版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、在對數(shù)據(jù)進行分類時,數(shù)據(jù)本身所具有的某些不良特點,如噪聲影響、簇間密度變差顯著、類間不平衡和特征維方差各不相同等問題都會影響分類效果。因此,研究適應(yīng)不良數(shù)據(jù)特點的分類算法,具有重要的理論和應(yīng)用價值。目前,雖然有DBSCAN,Trimmed k-means等算法也能處理一些不良特點的數(shù)據(jù),但是渴求一種通用的處理所有不良類型數(shù)據(jù)的分類算法是不現(xiàn)實的,根據(jù)數(shù)據(jù)的特點研究一些有針對性的抗干擾算法逐漸形成一種共識。
本文受分子動力學(xué)原理
2、的啟發(fā),在數(shù)據(jù)點之間引入引力和斥力的相互作用機制,并結(jié)合數(shù)據(jù)點在原始特征空間和迭代空間的距離、簇密度差和近鄰性等信息,提出了仿分子動力學(xué)數(shù)據(jù)聚類法;同樣考慮近鄰性和特征維方差等因素提出了橢球-平面分類法,并改進了基于核密度估計的數(shù)據(jù)分類算法。新的聚類方法除是對帶噪聲、簇間密度變差明顯的數(shù)據(jù)具有好的適應(yīng)力外,不需要預(yù)先設(shè)置簇個數(shù),可自動發(fā)現(xiàn)數(shù)據(jù)中可能包含的簇,并解決了引力模型中的黑洞問題。
基于核密度估計的數(shù)據(jù)分類法是實際應(yīng)用中
3、的常見分類法,它在處理不平衡類時可能出現(xiàn)諸如少數(shù)類的數(shù)據(jù)點錯分到多數(shù)類的問題。為了使該方法可處理不平衡類帶來的影響,并在不平衡類問題嚴(yán)重時也能發(fā)揮好的效果,本文對其進行了改進,在基于核密度估計的數(shù)據(jù)分類法中引入具有較小搜索區(qū)間的平滑因子,增強了其對不平衡類的適應(yīng)力。實驗表明這種改進是有效的,它提高了原方法對不平衡類的適應(yīng)力。
事實上,像基于核密度估計一類的分類方法在預(yù)測階段由于可能涉及整個樣本集的計算,當(dāng)數(shù)據(jù)集規(guī)模較大時其預(yù)測
4、開銷可能會很大。為了達到減小預(yù)測開銷,同時又使模型兼?zhèn)浒瑪?shù)據(jù)在特征維上方差信息的特點,本文提出了一種新的橢球-平面分類法,它是一個兩階段的監(jiān)督型分類方法。該方法利用橢球面和平面分類參考面進行分類,由于分類時待測點只需與相應(yīng)的參考面進行計算,使其時間開銷小于基于距離的 k最近鄰點方法和基于核密度估計一類的方法,并且強化了鄰近性原則。
以上算法除理論分析外,基于標(biāo)準(zhǔn)數(shù)據(jù)集都與其他現(xiàn)有方法進行了對比試驗,確認(rèn)了理論推導(dǎo)的正確性,為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)挖掘中若干方法的研究.pdf
- 數(shù)據(jù)挖掘分類方法研究.pdf
- 不均衡數(shù)據(jù)分類方法的研究.pdf
- 數(shù)據(jù)層資源適應(yīng)型若干優(yōu)化實現(xiàn)方法及應(yīng)用研究.pdf
- 若干圖像和語音數(shù)據(jù)分類問題研究.pdf
- 高維數(shù)據(jù)的若干分類問題及算法研究.pdf
- 分類數(shù)據(jù)挖掘中若干基本問題的研究.pdf
- 基因表達數(shù)據(jù)的若干挖掘方法研究.pdf
- 適應(yīng)概念漂移的數(shù)據(jù)流分類算法研究.pdf
- 數(shù)據(jù)挖掘方法的若干應(yīng)用.pdf
- 矩陣數(shù)據(jù)的分類預(yù)測方法
- 模式分類中數(shù)據(jù)選擇方法的研究.pdf
- 基于Hyperion數(shù)據(jù)的地物分類方法研究.pdf
- 數(shù)據(jù)流分類中若干問題的研究.pdf
- 基于分類超曲面的數(shù)據(jù)分類方法的研究.pdf
- 動態(tài)數(shù)據(jù)流分類方法研究.pdf
- 基因序列數(shù)據(jù)挖掘若干方法研究.pdf
- 數(shù)據(jù)挖掘中的高速可伸縮分類算法.pdf
- 數(shù)據(jù)層資源適應(yīng)型若干優(yōu)化實現(xiàn)方法及應(yīng)用研究(1)
- 面向不完備數(shù)據(jù)的分類方法研究.pdf
評論
0/150
提交評論