基于樣例及標記相關(guān)性的多標記學習算法研究.pdf_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、多標記學習作為一種解決多義性對象學習建模的框架,其研究成果已經(jīng)廣泛應用到諸如文本分類、網(wǎng)頁分類、場景分類等分類問題中,已然成為了機器學習研究領(lǐng)域的一個熱點問題。針對多標記分類問題,目前已經(jīng)涌現(xiàn)出了大量的學習算法,不管是基于k近鄰的方法,還是應用支持向量機的方法,以及運用決策樹的方法等,都可以將其歸為兩大類:算法適應法(algorithm adaptation methods,簡稱AAM)和問題轉(zhuǎn)換法(problem transforma

2、tion methods,簡稱PTM)。顧名思義,算法擴展法即在算法層面上解決多標記分類問題。同樣地,問題轉(zhuǎn)換法則是從問題本身出發(fā),把復雜的多標記問題轉(zhuǎn)化成“二類分類”問題,繼而運用簡單易實現(xiàn)的單標記學習算法去處理多標記分類問題。
  本文的緒論中簡述了多標記學習的研究背景及意義,然后對多標記學習在國內(nèi)外的研究現(xiàn)狀進行了詳細介紹;簡要介紹了多標記學習的理論基礎(chǔ),包括多標記學習問題定義,多標記學習策略簡介,以及多標記學習中常用的評估

3、標準、多標記學習中的典型算法、數(shù)據(jù)集等理論知識。多標記分類問題的研究關(guān)鍵是如何有效利用訓練好的分類器,將待分類樣例劃分到預先定義好的類別中,本文重點考察了多標記分類過程中標記相關(guān)性和屬性特征選擇這兩個方面,主要研究成果有:
  (1)基于多標記學習中存在的標記相關(guān)性問題,提出一種基于鄰域粗糙集的多標記分類改進算法。研究者在多標記學習中引入鄰域粗糙集模型,構(gòu)造了一個新的學習框架MLRS,運用鄰域粗糙集找出給定示例的所有可能相關(guān)的標簽

4、和排除所有不相關(guān)的標簽,根據(jù)鄰域和不同標記間的關(guān)系為樣例預測正確標記范圍。但是,要是一個類在邊界區(qū)域中因為正例過少,導致該類在通過計算得到的近鄰中占據(jù)很小的比例,此時如果只看數(shù)量很容易造成錯分。針對這個問題,本文對MLRS算法做了相應的改進,在邊界區(qū)域,除了考慮在訓練樣例和各個不同類別的近鄰樣例之間計算歐式距離這個因素,還要考慮個數(shù)的問題,這兩者之間可以建立起一個映射關(guān)系,然后用該映射關(guān)系預測測試樣例類別標記,實驗表明,本文提出的方法能

5、較好地提高算法的分類性能。
 ?。?)基于多標記學習中存在的屬性特征選擇的問題,提出一種基于類屬屬性的多標記局部加權(quán)分類算法。一個對象具有多種語義信息,是因為該對象同時含有描述這些語義的屬性。因此,對刻畫示例與標記間關(guān)系的屬性進行有效的轉(zhuǎn)換,將使多標記學習過程更加可靠。LIFT算法是基于類屬屬性的多標記學習方法,本文針對其不足提出了一種新的基于類屬屬性的多標記局部加權(quán)分類算法 LIFT-LOCW,該算法通過加權(quán)的方法提高了原算法的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論