2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩132頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、聚類分析作為一種無監(jiān)督學習方法,是機器學習領域重要研究方向之一。近年來,數據聚類正在蓬勃發(fā)展,聚類分析已成功應用于圖像處理,文本挖掘,生物信息學等諸多領域。
  本文重點研究聚類分析中兩個關鍵問題:相似性度量和聚類算法的設計及應用。聚類的目的是發(fā)現(xiàn)相似對象的集合,因此如何度量對象間的相似性是聚類分析中的一個關鍵問題。本文基于現(xiàn)有的高斯型相似度計算模型,提出了新的相似度計算模型,并針對數據特征對相似度的影響進行了討論,將本質維數作為

2、新的特征來改善相似性度量。在聚類算法設計及應用方面,針對不同的聚類問題,設計快速有效的聚類算法是十分必要的。本文分析了現(xiàn)有聚類算法的優(yōu)缺點,提出了一種快速的基于相似度矩陣的聚類算法,并將其應用到圖像分割中??紤]到現(xiàn)實中大多數圖像受到了噪聲干擾,為了降低噪聲對圖像分割和其他后續(xù)圖像分析帶來的影響,提出了一種基于稀疏表示的混合噪聲去噪算法。
  本文的主要工作包括:
  (1)提出一種加權的自適應高斯型相似性度量方法。傳統(tǒng)的高斯

3、型相似度適用于同密度簇的聚類問題,而且對于數據中的野值點不夠魯棒??紤]到實際數據中野值點和不同密度簇的存在,提出了一種新的魯棒的高斯型相似度計算方法?;谝延械淖赃m應高斯型相似度度量,新的相似度根據數據點的鄰域信息對每個數據點賦以權值,并通過降低野值點的權重來降低野值點與其他數據點的相似度。實驗表明新的相似性度量能更好地反映類內和類間數據點的相似性關系,得到更加滿意的聚類結果。
  (2)提出一種基于本質維數的相似性度量。相似性度

4、量不僅依賴于相似度計算公式,還依賴于數據的特征。數據集中的每個類可以看作是一個子流形,通過定義反映流形拓撲結構的數據特征來對各個子流形進行劃分。本質維數可以用于區(qū)分不同的流形結構,位于同一流形的數據點的本質維數應該保持一致,具有不同本質維數的數據點通常也可以認為分布在不同的流形上。通過數據點的鄰域信息來估計數據點的本質維數,將本質維數作為數據的新的特征,結合數據的原始特征來計算新的相似度。實驗表明,基于新的相似度的聚類結果要優(yōu)于單獨使用

5、本質維數或者原始特征的相似度得到的聚類結果。
  (3)對于具有復雜結構的數據集,只通過無監(jiān)督的方法改變相似性度量很難達到滿意的聚類結果。半監(jiān)督聚類是利用有限的標簽數據對全部數據的聚類過程進行指導,從而可以得到更好的聚類結果。本文提出一種基于近鄰傳播算法的半監(jiān)督聚類算法。近鄰傳播算法是基于相似度矩陣的聚類算法,新算法根據約束對先驗信息調整相似度矩陣,進而改善聚類結果。實驗結果表明,通過加入少量先驗約束對信息,半監(jiān)督近鄰傳播算法較大

6、程度地改善了無監(jiān)督近鄰傳播算法的聚類結果。
  (4)基于Wittgenstein的家族相似性,提出了一種基于相似度矩陣的聚類算法。已有的基于相似度矩陣的聚類算法要么時間復雜度較高,要么需要調節(jié)的參數較多。新算法通過相似度矩陣構建鄰接矩陣,然后在鄰接矩陣中發(fā)現(xiàn)連通分支進而對數據進行劃分。與常用的基于相似度矩陣的譜聚類算法相比,新算法無需計算特征向量,大大降低了時間消耗。而且,在給定相似度矩陣的基礎上,新算法不需要設置任何參數。實驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論