版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、本文在模式分類的背景下,對(duì)特征選取的一些問題進(jìn)行了深入研究,主要工作如下。 1)粗糙數(shù)據(jù)模型是Kowalczyk提出的一種廣義粗糙集模型,具有結(jié)構(gòu)簡(jiǎn)單、實(shí)用性強(qiáng)的優(yōu)點(diǎn),但也存在建模效率低、分類精度和噪聲數(shù)據(jù)處理能力嚴(yán)重依賴于數(shù)據(jù)空間的柵格劃分的弱點(diǎn)。為此,文中引入了模糊自適應(yīng)聚類技術(shù),將數(shù)據(jù)空間的硬劃分轉(zhuǎn)化為與模式類相適應(yīng)的模糊劃分,提出了一種基于粗糙集理論的規(guī)則模式分類器模型——模糊粗糙數(shù)據(jù)模型。該模型能夠用較少數(shù)目的模糊類反
2、映出數(shù)據(jù)集中具有超橢球、超平面或超線型的特征模式類,有效地提高了分類器模型的建模效率和數(shù)據(jù)概括能力。不同數(shù)據(jù)集的實(shí)驗(yàn)測(cè)試結(jié)果驗(yàn)證了該模型的優(yōu)良性能。 2)互信息是特征選取問題中一類非常有價(jià)值的特征評(píng)價(jià)準(zhǔn)則,但卻存在高維空間下難以計(jì)算的困難。針對(duì)這一問題,論文首先對(duì)各種特征評(píng)價(jià)準(zhǔn)則進(jìn)行了系統(tǒng)研究,在此基礎(chǔ)上,推導(dǎo)出了高維特征空間在信息均勻分布條件下,候選特征f<,i>與輸出類別C之間在給定已選特征子集S情況下的條件互信息I(C;f
3、 <,i> |S)的近似估計(jì)公式。利用該公式,可以在特征信息不嚴(yán)重背離均勻分布的情況下對(duì)特征進(jìn)行有效地評(píng)價(jià)?;谠摴烙?jì)公式,提出了一種基于已選特征子集二階互信息的特征選取Filter算法(SOMIFS),該方法能夠自適應(yīng)地估計(jì)出候選特征與已選特征之間關(guān)于輸出類別的冗余信息,不再象Battiti的MIFS方法及Kwak和Chow的MIFS-U方法那樣,需要預(yù)先人為設(shè)定與特征冗余程度有關(guān)的參數(shù)β的數(shù)值,從而大大改進(jìn)了算法的性能。另外,針對(duì)特
4、征信息任意分布的情況,給出了一種基于互信息的構(gòu)造性特征評(píng)價(jià)準(zhǔn)則;基于該評(píng)價(jià)準(zhǔn)則,進(jìn)一步提出了特征信息任意分布條件下的構(gòu)造性特征選取方法(MICC)。 通過在不同的解析數(shù)據(jù)集和基準(zhǔn)數(shù)據(jù)集上的測(cè)試與比較,實(shí)驗(yàn)結(jié)果表明,與Battiti的MIFS及Kwak和Chow的MIFS-U等特征選取方法相比,本文所提方法SOMIFS和MICC能夠提供更加準(zhǔn)確、有效的特征評(píng)價(jià)準(zhǔn)則,具有更強(qiáng)的適應(yīng)性和更好的預(yù)測(cè)性能。 3)在輸入特征之間存在
5、復(fù)雜關(guān)聯(lián)關(guān)系的情況下,使用單一評(píng)價(jià)準(zhǔn)則的filter方法由于存在“嵌套”效應(yīng)等弱點(diǎn),往往難以發(fā)現(xiàn)最優(yōu)特征子集。針對(duì)這一問題,文中提出了一種基于互信息、以filter為局部搜索方式、以混合遺傳算法為優(yōu)化組織形式的特征選取Wrapper方法。該方法將遺傳算法的全局搜索能力強(qiáng)、filter方法的計(jì)算速度快和wrapper方法的預(yù)測(cè)精度高等三方面的優(yōu)勢(shì),以互信息為紐帶完美地結(jié)合在一起,該使得該方法具有很強(qiáng)的最優(yōu)特征子集搜索能力。不同類型的數(shù)據(jù)實(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 模式分類中特征選擇問題的研究.pdf
- 文本分類特征選取技術(shù)研究.pdf
- 模式分類中特征選擇算法研究.pdf
- 基于基因本體的腫瘤分類特征基因選取研究.pdf
- 模式分類中特征選擇算法的研究.pdf
- 面向文本分類的特征詞選取方法研究.pdf
- 人臉識(shí)別中圖像特征選取的研究.pdf
- 模式分類中特征降維方法的研究
- 基于特征選取的網(wǎng)絡(luò)游戲與視頻業(yè)務(wù)分類研究.pdf
- 模式分類中特征降維方法的研究.pdf
- 入侵檢測(cè)中特征選取方法的研究.pdf
- 神經(jīng)元分類的最優(yōu)幾何形態(tài)特征選取.pdf
- 分類器設(shè)計(jì)中特征選擇問題的研究.pdf
- 多分類器組合中的基分類器選取方法.pdf
- 模式識(shí)別分類中特征約簡(jiǎn)的方法研究.pdf
- 圖書分類中輔助區(qū)分號(hào)的選取
- 特征提取和模式分類問題在人臉識(shí)別中的應(yīng)用與研究.pdf
- 38179.基于基因表達(dá)譜的胃癌分類特征基因選取研究
- 多標(biāo)簽學(xué)習(xí)中特征選擇和分類問題的研究.pdf
- 融入本體的問題特征模型在中文問題分類中的研究.pdf
評(píng)論
0/150
提交評(píng)論