

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、特征選擇是統(tǒng)計(jì)模式識(shí)別中的一個(gè)基本步驟和重要任務(wù),并被廣泛的應(yīng)用于圖像處理、文本挖掘、計(jì)算神經(jīng)學(xué)以及生物信息學(xué)等諸多領(lǐng)域。在這些實(shí)際應(yīng)用中,研究對(duì)象的觀測(cè)值(即樣本)雖然含有大量的特征,但對(duì)于某個(gè)特定的識(shí)別任務(wù)來(lái)說(shuō),這些特征并非都是相關(guān)的有效特征,也同時(shí)存在冗余的或是與任務(wù)不相關(guān)的噪聲特征。這些噪聲嚴(yán)重影響分類(lèi)精度。為解決這一問(wèn)題,特征選擇技術(shù)應(yīng)運(yùn)而生。特征選擇旨在從樣本的所有特征中將相關(guān)的有效特征挑選出來(lái),同時(shí)將不相關(guān)的特征剔除。另一
2、方面,特征選擇也可以避免由于樣本的特征數(shù)過(guò)多導(dǎo)致的維數(shù)災(zāi)難,降低模式識(shí)別的時(shí)間開(kāi)銷(xiāo)。樣本的特征維數(shù)越高,特征選擇的重要性也就越發(fā)突顯出來(lái)。為了挑選出相關(guān)的、低冗余的更好的特征子集,研究者們提出了不同的優(yōu)化方案。如最小冗余最大相關(guān)性特征選擇(mRMR)方法,全局冗余最小化(GRM)方法,不相關(guān)LASSO(ULASSO)方法,等等。在前入研究的基礎(chǔ)上,本文從一個(gè)新的角度提出了優(yōu)化的特征選擇方法,并提出了相應(yīng)的有效算法。
本文的主要
3、研究?jī)?nèi)容有以下三部分:
(1)彈性網(wǎng)絡(luò)(EN)模型與常用的最小絕對(duì)收縮和選擇算子(LASSO)相比,在選擇相當(dāng)數(shù)量的特征的情況下,EN模型的效果要優(yōu)于LASSO。特別是在樣本所含特征數(shù)遠(yuǎn)遠(yuǎn)大于樣本數(shù)時(shí),EN的效果比LASSO更令人滿(mǎn)意。出于這種考慮,本文將特征與類(lèi)別之間的相關(guān)性作為約束,以權(quán)重的形式融入EN模型中,提出了基于區(qū)分性彈性網(wǎng)絡(luò)的二類(lèi)別特征選擇(TFS_DEN)方法。通過(guò)對(duì)回歸系數(shù)加權(quán)的方式,在目標(biāo)函數(shù)的優(yōu)化過(guò)程中,
4、使對(duì)應(yīng)于與類(lèi)別標(biāo)簽具有強(qiáng)相關(guān)性的特征的回歸系數(shù)變大,反之則被壓縮。這樣一來(lái),回歸系數(shù)的區(qū)分性被放大,挑選出的特征與類(lèi)別的相關(guān)性更強(qiáng),同時(shí)有利于提高分類(lèi)準(zhǔn)確率。在這一部分選取兩種相關(guān)性度量,并給出相應(yīng)的4種不同形式的權(quán)重。對(duì)于TFS_DEN,在這一部分還給出了有效的迭代求解算法以及與算法相對(duì)應(yīng)的收斂性證明。在多個(gè)二類(lèi)數(shù)據(jù)集上的相關(guān)實(shí)驗(yàn)結(jié)果說(shuō)明了TFS_DEN的性能優(yōu)于一些現(xiàn)有的特征選擇方法。美中不足的是,TFS_DEN方法僅能處理只包含兩
5、類(lèi)樣本的特征選擇問(wèn)題。
(2)本文進(jìn)一步將TFS_DEN方法擴(kuò)展到多類(lèi)別的情況,使其適用于更多的實(shí)際應(yīng)用問(wèn)題,形成基于區(qū)分性擴(kuò)展彈性網(wǎng)絡(luò)的多類(lèi)別特征選擇(MFS_DEEN)方法。由于問(wèn)題被擴(kuò)展到多類(lèi)別的情況,TFS_DEN中的權(quán)重形式不再適用。因此,針對(duì)MFS_DEEN給出了不同于TFS_DEN的4種權(quán)重形式,同時(shí)提出了不同于TFS_DEN的新的有效迭代求解算法,并給出了相應(yīng)的收斂性證明。在多個(gè)多類(lèi)別數(shù)據(jù)集上進(jìn)行了相關(guān)實(shí)驗(yàn),其
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于遺傳算法的特征選擇方法的改進(jìn)研究.pdf
- 基于改進(jìn)互信息的多尺度彈性配準(zhǔn)方法研究.pdf
- 基于隨機(jī)搜索策略的多標(biāo)簽特征選擇方法研究.pdf
- 基于一種改進(jìn)特征選擇方法的股票分類(lèi)研究
- 基于一種改進(jìn)特征選擇方法的股票分類(lèi)研究.pdf
- 基于框架擴(kuò)展的多描述方法研究.pdf
- 27540.基于改進(jìn)特征選擇方法的文本情感分類(lèi)研究
- 多類(lèi)別特征共享集成學(xué)習(xí)研究.pdf
- 基于類(lèi)別的特征選擇算法的文本分類(lèi)系統(tǒng).pdf
- 基于綜合比率因子的互信息特征選擇方法的改進(jìn).pdf
- 基于改進(jìn)深度神經(jīng)網(wǎng)絡(luò)的特征提取方法研究.pdf
- 基于改進(jìn)的BPSO和支持向量機(jī)的特征基因選擇方法研究.pdf
- 基于SVM的特征選擇方法研究.pdf
- 基于多特征與改進(jìn)霍夫森林的行人檢測(cè)方法.pdf
- 多類(lèi)別智能分類(lèi)器方法研究.pdf
- 基于特征選擇的多標(biāo)簽分類(lèi)算法研究.pdf
- 基于擴(kuò)展網(wǎng)頁(yè)和公平特征選擇的網(wǎng)頁(yè)分類(lèi)算法研究.pdf
- 基于隨機(jī)有限集多擴(kuò)展目標(biāo)跟蹤方法的研究.pdf
- 基于多特征的圖像檢索方法研究.pdf
- 基于深度學(xué)習(xí)的多模態(tài)數(shù)據(jù)特征提取與選擇方法研究.pdf
評(píng)論
0/150
提交評(píng)論