基于半監(jiān)督的多流形學習算法研究.pdf_第1頁
已閱讀1頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、流形學習是一種非線性降維技術,它能夠較好地發(fā)現(xiàn)隱藏在高維數(shù)據(jù)中的低維流形,其已被廣泛應用于數(shù)據(jù)分類問題中以解決維數(shù)災難問題。但是,大部分已有的流形學習算法對單一采樣的數(shù)據(jù)有效,對采樣于多流形的數(shù)據(jù)卻有一定的局限性。在一般的分類問題中,認為每個類別中的數(shù)據(jù)可能張成一個自己的子流形,多個類別數(shù)據(jù)則張成多個子流形。然而,目前對于多流形問題的研究工作還比較少。
  隨著數(shù)據(jù)獲取技術的提高,我們容易獲得大量未標記樣本點,但因人力和物力的局限

2、,我們難以獲取大量有標記的樣本。所以,如何充分發(fā)揮少量有標記樣本點的價值,并結合大量的未標記樣本點來指導學習是流形學習面臨的挑戰(zhàn)之一。而半監(jiān)督流形學習方法正好為此提供了一個較好的解決方案。
  但是,由于應用過程中所獲取的高維數(shù)據(jù)難免受到噪聲的“污染”,使無監(jiān)督和半監(jiān)督的流形學習算法的性能都受到了影響。它們對噪聲并不魯棒,主要是因為噪聲的存在,在一定程度上破壞了原數(shù)據(jù)點間的局部幾何關系,使得算法在挖掘數(shù)據(jù)的本質特征時造成了偏差。目

3、前針對魯棒性能的改善已有一些相應的工作,但是其大多基于無監(jiān)督流形學習算法做出的改進,對于半監(jiān)督方面的魯棒性問題研究甚少。
  因此,本文主要圍繞流形學習中的多流形問題以及魯棒性問題展開,并結合半監(jiān)督學習技術對流形學習算法進行改進。具體來講,本文的主要工作體現(xiàn)在以下兩方面:
  1.針對多流形問題,本文給出了一種新穎的方法,即基于多流形的半監(jiān)督學習算法(Semi-supervised Learning On Multi-Man

4、ifold,簡稱SSL-MM)。該算法通過求解一個稀疏優(yōu)化模型來為每個樣本點構造局部幾何結構,使得所構造的局部幾何關系能夠有效減少分布于不同流形的近鄰點所帶來的影響。然后在已知部分樣本點的標簽信息情況下,通過在低維空間中保持已學習到的局部幾何關系來對未標記樣本進行標簽預測。同時,本文在多個數(shù)據(jù)集上進行了大量的對比實驗,用以說明所提算法SSL-MM的有效性。
  2.針對噪聲敏感性問題,提出了一個魯棒半監(jiān)督流形學習的算法框架(Rob

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論