圖上的隨機游走學習.pdf_第1頁
已閱讀1頁,還剩97頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、傳統(tǒng)的處理機器學習和數(shù)據(jù)挖掘問題的方法都需要很強的前提假設(shè)或者大量的先驗知識,所以當現(xiàn)實問題與前提假設(shè)不一致時或者先驗知識不足夠時就會導致傳統(tǒng)方法性能的降低。近年來大量的令傳統(tǒng)方法無能為力的學習問題不斷涌現(xiàn)出來,而隨機過程中的隨機游走(Random Walk)就是處理這類棘手問題的一種有效方法。 隨機游走在計算機學科的信息檢索領(lǐng)域已經(jīng)得到了成功的應(yīng)用,現(xiàn)在正被越來越多地應(yīng)用到機器學習和數(shù)據(jù)挖掘等領(lǐng)域。在此背景下,我們提出圖上的隨

2、機游走學習,創(chuàng)造性地將隨機游走作為一項基本技術(shù),用于改善傳統(tǒng)的有監(jiān)督學習,半監(jiān)督學習和無監(jiān)督學習中的困難問題,本論文的具體貢獻如下。 (1)隨機游走分類器模型?;趫D上的隨機游走理論,我們提出了隨機游走基礎(chǔ)分類器模型、互補的隨機游走分類器模型、組合隨機游走分類器模型,詳細地分析了這些模型下的最優(yōu)分類器的設(shè)置和性能,給出了各種模型對應(yīng)的有效分類器實現(xiàn)方法,從理論上證明了我們提出的組合方法可以大大提升基礎(chǔ)分類器的性能。 (2

3、)多層隨機游走框架。在簡單隨機游走理論的啟發(fā)下,我們提出一個統(tǒng)一的半監(jiān)督學習框架——多層隨機游走,通過構(gòu)建各種組件級的隨機游走模型,可以產(chǎn)生一系列對應(yīng)的多分類標簽傳播算法。多層隨機游走框架不僅囊括了目前為止的絕大多數(shù)標簽傳播算法,而且還能產(chǎn)生更多新的高效的組件傳播算法,這些結(jié)果被我們從正則化的角度得到進一步的證實。另外針對有標簽數(shù)據(jù)不平衡分布情況,我們提出了一種簡單的平衡策略,可用于改進任何標簽傳播算法的分類性能。實驗結(jié)果證明多層隨機游

4、走框架下的組件傳播算法和平衡策略都是非常有效的。 (3)隨機游走的細胞自動機聚類。借鑒隨機游走的思想,受螞蟻分巢居住行為的啟發(fā),使用細胞自動機的形式提出了螞蟻睡眠模型(ASM)。在此模型上設(shè)計一個螞蟻隨機游走聚類算法(RWAC),該算法用人工螞蟻代表一個數(shù)據(jù)對象,讓整個螞蟻群體在隨機游走中動態(tài)地、自適應(yīng)地、自組織地形成多個獨立的子群體,使不同類別的螞蟻之間相互分離,而同類的螞蟻之間高度緊密地排列,從而達到對數(shù)據(jù)聚類的目的。在螞蟻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論