2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、樣本分類一直是數據挖掘領域的研究熱點,傳統(tǒng)的樣本分類是單標簽分類,這類樣本只與單個標簽相關,然而現實生活中的樣本往往同時屬于多個范疇,對這類樣本的處理被稱為多標簽學習問題。由于多標簽數據的特殊性,使得傳統(tǒng)的分類方法無法直接對其進行處理,因此人們相繼提出了多種方法用于處理多標簽數據分類,這些方法總體來說可以分為兩類:基于問題轉化的方法與基于算法轉化的方法?;趩栴}轉化的方法將多標簽數據通過某種轉換策略轉換成單標簽數據,然后利用單標簽分類方

2、法來進行處理。基于算法轉化的方法則是通過改進已有的單標簽數據分類方法,使其能直接用于多標簽數據分類。
  本文主要研究基于K近鄰多標簽學習方法,主要完成的工作內容如下:
  1:對于已有的懶惰型多標簽學習方法:一種新型的多標記懶惰學習方法,該方法在構建樣本近鄰集時對于每個樣本都選取相同個數的近鄰點,這種取樣本近鄰點的方法沒有充分考慮樣本分布特點。本文針對這一缺點提出改進,將粒計算思想融合到該方法中,提出基于粒計算的多標簽懶惰

3、學習方法,該方法在構建樣本近鄰集時充分考慮樣本分布特點,通過粒度控制,動態(tài)選取不同樣本的近鄰點個數,使得構建的樣本近鄰集中的樣本具有較高的相似性,從而改進算法效果。在給出改進方法后,本文對改進方法與原方法進行了實驗對比,對比結果表明改進的方法在總體上要優(yōu)于原方法。
  2:對于已有的基于隨機游走模型的多標簽學習方法:一種基于隨機游走模型的多標簽分類方法,該方法構建的隨機游走圖是將所有有相同標簽的樣本點都連接起來,導致隨機游走圖中邊

4、數過多,從而隨機游走達到收斂的過程較復雜,從而導致算法復雜性過高。本文將機器學習領域的隨機游走圖與K近鄰方法相結合,提出基于K近鄰與隨機游走模型的多標簽學習方法,該方法首先對訓練集中的每個樣本點找到其K個近鄰點,構建基于訓練集的KNN圖,然后基于每個測試樣本與已構建的KNN圖都構建一個基于KNN的隨機游走圖,在該圖上進行隨機游走過程,得到一個穩(wěn)定的概率分布向量,通過該向量得到該測試樣本擁有各個標簽的概率值,最后給出與該方法對應的閾值選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論