基于集成學(xué)習(xí)的多標(biāo)記學(xué)習(xí)算法研究.pdf_第1頁
已閱讀1頁,還剩67頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、在傳統(tǒng)機(jī)器學(xué)習(xí)算法中,一個(gè)樣本僅對應(yīng)單個(gè)類別標(biāo)記。而現(xiàn)實(shí)世界中,一個(gè)對象往往同時(shí)具備多個(gè)語義信息。為了對這些多義性對象進(jìn)行建模,多標(biāo)記學(xué)習(xí)算法應(yīng)運(yùn)而生。在多標(biāo)記學(xué)習(xí)范式下,每個(gè)對象以一個(gè)示例來描述其特征信息,并以一個(gè)與之對應(yīng)的標(biāo)記集合來描述其語義信息。集成學(xué)習(xí)作為一類重要的機(jī)器學(xué)習(xí)技術(shù),可以有效提升學(xué)習(xí)算法的泛化性能。本文將集成學(xué)習(xí)技術(shù)用于求解多標(biāo)記學(xué)習(xí)問題,主要做了如下兩方面的工作:
  一方面,現(xiàn)實(shí)世界的很多應(yīng)用都可以輕易地獲

2、取大量數(shù)據(jù),而獲取這些數(shù)據(jù)的真實(shí)標(biāo)記卻極為費(fèi)時(shí)且昂貴,該問題在多標(biāo)記學(xué)習(xí)中顯得尤為突出。因此,通過對未標(biāo)記數(shù)據(jù)的利用來提高學(xué)習(xí)系統(tǒng)的性能具有重要的研究價(jià)值。本文對傳統(tǒng)的協(xié)同訓(xùn)練半監(jiān)督學(xué)習(xí)方法進(jìn)行擴(kuò)展,提出了一種新的多標(biāo)記半監(jiān)督學(xué)習(xí)方法COINS(CO-training for INductive Semi-supervised multi-label learning)。相比于已有直推式多標(biāo)記半監(jiān)督學(xué)習(xí)方法,COINS可以實(shí)現(xiàn)歸納式學(xué)習(xí)

3、建模且具有更好的泛化性能。
  另一方面,多標(biāo)記學(xué)習(xí)中各類別標(biāo)記往往具有其獨(dú)特的性質(zhì),為每個(gè)標(biāo)記構(gòu)造反映其特性的類屬屬性是求解多標(biāo)記學(xué)習(xí)問題的一類重要技術(shù)。LIFT算法通過聚類的方式獲取每個(gè)標(biāo)記的類屬屬性以提高系統(tǒng)性能,但忽視了多標(biāo)記學(xué)習(xí)中尤為重要的標(biāo)記相關(guān)性。本文通過聚類集成的方式將標(biāo)記相關(guān)性引入類屬屬性的生成過程,提出了基于聚類集成的類屬屬性多標(biāo)記學(xué)習(xí)算法LIFTACE(multi-label learning with La

4、bel-specIfic FeaTures viA Clustering Emsemble)。相比于LIFT算法,LIFTACE算法可以有效利用聚類集成機(jī)制獲得更好的泛化性能。
  本文共分為五章。第一章主要介紹多標(biāo)記學(xué)習(xí)的基本概念、研究現(xiàn)狀,以及仍有待研究的問題;第二章給出多標(biāo)記學(xué)習(xí)的問題定義,并針對有待研究的問題分析討論了5種已有的多標(biāo)記學(xué)習(xí)算法;第三章和第四章分別介紹兩種基于集成學(xué)習(xí)的多標(biāo)記學(xué)習(xí)算法,即基于協(xié)同訓(xùn)練的半監(jiān)督多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論