面向高維數(shù)據的多流形學習算法研究.pdf_第1頁
已閱讀1頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、流形學習是機器學習與數(shù)據挖掘領域的一個重要研究方向。其研究目的在于揭示隱藏在高維數(shù)據集中的內在低維結構,從而能夠重構并進行非線性維數(shù)約簡或者實現(xiàn)數(shù)據的可視化。經典的流形學習算法總是假設高維數(shù)據批量存在于單一流形,但是現(xiàn)實生活中紛繁復雜的數(shù)據大多存在于多個不同流形上,而且往往不可能一次性獲取,甚至這些流形之間可能還存在嚴重的交叉重疊。因此對多流形數(shù)據的識別分解與多流形的增量學習是流形學習研究中的一個重要的課題。本文針對等維獨立多流形數(shù)據的

2、增量問題與相交多流形數(shù)據的識別分解進行了研究,主要內容如下:
 ?。?)針對目前多流形分解算法普遍不具有增量能力這一現(xiàn)狀,提出一種針對等維獨立多流形的增量學習算法IMM-ISOMAP。首先通過動態(tài)鄰域算法計算每個新增樣本的鄰域信息,然后結合原來已經得到的子流形信息通過擴展的方式將新樣本依次劃分到新的子流形中,在新子流形中僅修改受影響的關鍵路徑,這種增量式的處理避免重新計算全部的鄰域關系,同時對新得到的子流形中由于新增樣本可能造成的

3、“短路”或者沖突路徑進行檢測并處理,最后依據各子流形間的鄰接關系拼接出整個樣本集的最終低維嵌入,進而實現(xiàn)其數(shù)據集的可視化。通過在人工的增量數(shù)據與不斷增量變化的實際數(shù)據上進行實驗,結果都表明該算法可以有效分解多流形數(shù)據,而且算法的增量能力,將來能很好的應用于大規(guī)模數(shù)據。
 ?。?)針對目前尚沒有一種能夠很好處理相交多流形數(shù)據的算法,本文基于MPPCA模型提出一種面向高維相交多流形數(shù)據的分解算法D-MPPCA。首先利用動態(tài)鄰域算法計算

4、每個樣本數(shù)據的切空間與近鄰關系信息,然后利用MPPCA模型將相交多流形數(shù)據分成若干個“不相交塊”,最后通過擴展這些“不相交塊”而實現(xiàn)對相交多流形數(shù)據的識別與分解。結果表明,該算法在人工相交多流形數(shù)據和實際高維圖像數(shù)據上均有很高的分解精度,相較于其他算法極大的提高了辨別能力。
  以上研究工作一方面在處理多流形數(shù)據時對現(xiàn)有流形學習算法作出了改進,不僅得到更準確的鄰域圖,而且通過引入增量學習,大大提高了算法的效率。另一方面使得算法能夠

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論