改進(jìn)的LMS-KNN近鄰分類方法研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、近鄰分類算法作為經(jīng)典的機(jī)器學(xué)習(xí)算法之一,因其無需估計參數(shù)、易于實現(xiàn)、適合多分類問題的特點,近年來在廣告、聊天機(jī)器人、網(wǎng)絡(luò)安全、醫(yī)療保健、營銷策劃等領(lǐng)域得到了廣泛應(yīng)用。其中,基于局部均值與類均值的近鄰分類算法(Nearest neighbor classification based on local mean and class mean,LMS-KNN)是針對K近鄰分類(K-nearest neighbor classificatio

2、n)對離群點不敏感,沒有利用樣本全局信息等問題的一種改進(jìn)算法,改進(jìn)后的算法雖然在分類精度和分類效率得到一定的提高,但是該算法還存在一些弊端。數(shù)據(jù)的不平衡性會影響 LMS-KNN的分類精度,同時該算法涉及到很多參數(shù)的設(shè)置,如近鄰值K的選取、權(quán)值的確定、距離度量方式的選取等等。因此,為了進(jìn)一步改進(jìn) LMS-KNN算法的分類精度,本文進(jìn)行了以下的研究工作:
  1)總結(jié)分析了幾種常用的近鄰分類方法和局部均值與類均值的近鄰分類算法,對比了

3、它們各自的算法原理和優(yōu)缺點,并簡單介紹了文中所用到的幾種優(yōu)化算法。
  2)針對不平衡數(shù)據(jù)對LMS-KNN分類精度的影響,運用迭代近鄰過采樣的算法對數(shù)據(jù)進(jìn)行預(yù)處理,并把處理后的近似平衡數(shù)據(jù)集,用半監(jiān)督的局部均值與類均值進(jìn)行分類。
  3)采用交叉驗證與傳統(tǒng)迭代算法確定LMS-KNN分類算法參數(shù),本文先將該分類算法交叉驗證誤差模型化,再把類均值向量的權(quán)重基于客觀決策信息確定為數(shù)學(xué)公式,最終運用步長優(yōu)化的統(tǒng)一迭代法來對加權(quán)權(quán)重進(jìn)

4、行選取,在平衡主客觀決策規(guī)則的情況下改進(jìn)傳統(tǒng)算法的分類精度和分類效率。
  4)為了優(yōu)化LMS-KNN分類算法參數(shù)的確定,利用遺傳算法(Genetic Algorithm)可以在不依賴問題具體領(lǐng)域的情況下求解非線性、多目標(biāo)等復(fù)雜優(yōu)化問題,提出了一種基于遺傳算法的局部均值和類均值最近鄰分類算法,該方法選取類均值的權(quán)重為初始種群,以分類誤差為評價函數(shù),通過遺傳迭代選取最佳的類均值特征權(quán)重,與傳統(tǒng)的KNN、LM-KNN(A local

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論