選擇性聚類融合算法研究.pdf_第1頁
已閱讀1頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、聚類融合是將不同算法或者同一算法使用不同參數(shù)得到的大量聚類成員利用融合函數(shù)進行融合,從而獲得最終聚類結(jié)果。聚類融合已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域的研究熱點。但是,傳統(tǒng)的聚類融合方法通常將所有產(chǎn)生的聚類成員都參與融合。但是在監(jiān)督分類學(xué)習(xí)中,選擇分類融合的已經(jīng)獲得了很大的研究進展,對于無監(jiān)督的選擇性聚類融合直到最近幾年才逐漸得到重視。研究表明,選擇性聚類融合方法能很好地提高聚類分析的準確性等性能。論文針對選擇性聚類融合中的數(shù)據(jù)降維、選擇策略、融合函數(shù)

2、設(shè)計等算法進行了研究,并將選擇性聚類融合算法應(yīng)用于多聚類問題分析中。
  論文首先對數(shù)據(jù)降維方法進行了研究,針對傳統(tǒng)的PCA降維方法對異常值、噪聲敏感問題以及矩陣的秩計算非凸、不連續(xù)且計算復(fù)雜等問題,提出聯(lián)合L1范數(shù)和跡范數(shù)的數(shù)據(jù)降維模型,針對模型的優(yōu)化求解提出了基于增強拉格朗日乘子的優(yōu)化算法。理論的數(shù)學(xué)分析和可視化的實驗結(jié)果都表明模型和優(yōu)化算法的有效性。
  研究了選擇性聚類融合的選擇策略問題,理論上證明了聯(lián)合聚類質(zhì)量和差

3、異度的選擇性聚類融合確實優(yōu)于融合所有聚類成員的融合算法,針對選擇策略中參照成員的確定過于簡單問題,提出了基于聚類有效性評價方法的參照成員選擇方法,在此基礎(chǔ)上,針對聚類成員對最終聚類結(jié)果的作用不同,提出了基于容錯關(guān)系信息熵的屬性重要性加權(quán)方法,最后論文給出了選擇加權(quán)聚類融合算法的框架。論文還對算法中的聚類簇數(shù)和平衡因子進行了優(yōu)化分析,并提出基于融合準則函數(shù)的聚類簇數(shù)優(yōu)化算法。
  研究了選擇性聚類融合中融合函數(shù)的設(shè)計問題,提出利用非

4、負矩陣分解(NMF,Nonnegative Matrix Factorization)解決聚類融合問題,在此基礎(chǔ)上,引入了譜聚類算法對聚類成員進行分組選擇,提出了基于NMF的選擇性聚類融合算法。論文進一步分析具有二進制特征的數(shù)據(jù),提出了基于二進制矩陣分解(BMF,Binary Non-negativeMatrix Factorization)的聚類融合算法和基于BMF的選擇性聚類融合算法。通過大量的仿真實驗分析發(fā)現(xiàn),對于文本和人工數(shù)據(jù)集

5、算法準確性大大提高,但對于公共數(shù)據(jù)集,其準確性不穩(wěn)定。
  論文將選擇性聚類融合算法應(yīng)用于多聚類問題分析,提出了基于選擇性聚類融合的多聚類算法。算法利用選擇性聚類融合技術(shù),形成聚類成員的相似矩陣,基于此矩陣構(gòu)建聚類成員的層次樹,利用基于模塊化的方法對層次樹進行分割,從而得到多聚類結(jié)果。大量的實驗結(jié)果表明,算法得到的多聚類結(jié)果差異度較大,但聚類結(jié)果本身的質(zhì)量較好。
  論文最后對全文進行了總結(jié),提出了今后將繼續(xù)進行的研究方向。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論