聚類算法及其應用研究.pdf_第1頁
已閱讀1頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,隨著數(shù)據(jù)采集和存儲技術的飛速發(fā)展,很多領域都積累了大量的數(shù)據(jù)。為了從數(shù)據(jù)中發(fā)現(xiàn)有價值的知識和規(guī)律,人們結合數(shù)據(jù)庫、統(tǒng)計學及機器學習等技術,提出數(shù)據(jù)挖掘來解決這一難題。聚類分析技術是數(shù)據(jù)挖掘中的經(jīng)典內(nèi)容,是各學科研究的重要工具。 本論文在廣泛閱讀相關文獻、深入了解聚類算法的原理與應用的基礎上,在算法的改進、應用上做了如下工作: (1)針對經(jīng)典的聚類算法普遍存在的形狀依賴、合理的類別參數(shù)選擇及對噪聲敏感等問題,聯(lián)合數(shù)

2、值歸約、基于壓縮數(shù)據(jù)的變種K-means算法和加權投票法,同時結合RMSSTD&RS聚類有效性指標提出了一個自動聚類算法。較好的解決了帶噪聲的任意形狀的大數(shù)據(jù)集的聚類問題,并具有一定的增量處理能力。 (2)傳統(tǒng)的基于密度的算法和經(jīng)典的CLIQUE子空間聚類算法都是從尋找數(shù)據(jù)的密集區(qū)域入手去解決問題。本文從稀疏區(qū)域的角度出發(fā)進行了子空間聚類的嘗試,提出了基于競爭的修剪方式和形式化的“投影尋蹤”搜索策略來得到合適的子空間并生成類。實

3、驗證明在控制計算復雜度的同時提高了算法的精度,在對輸入?yún)?shù)的魯棒性上也取得了較好的效果。 (3)針對具體的目標識別問題。首先對幾個具有一定分類特性的特征進行了簡單的融合;接著在本文提出的子空間聚類算法基礎上,采用基于競爭的修剪方式得到了新的易于區(qū)分的特征;最后用確定的類別參數(shù)代替聚類有效性指標作為投票法的類融合停止準則,建立了分類器的多中心表達模型,并結合兩級糾錯訓練模式設計了合理有效的識別分類器,在分類測試中取得了較好的效果。

4、 本文的貢獻和創(chuàng)新主要體現(xiàn)在上述兩個算法的改進和應用上: (1)完成了自動聚類算法,其創(chuàng)新點體現(xiàn)在:一,結合多種方法較好的解決了傳統(tǒng)聚類算法遇到的問題;二,改進了傳統(tǒng)的k-means算法使之適應在壓縮數(shù)據(jù)上進行聚類操作;三,對投票法進行了加權處理以適應壓縮數(shù)據(jù)。 (2)針對高維數(shù)據(jù)的聚類問題提出了從稀疏區(qū)域著手的基于密度和網(wǎng)格的子空間聚類算法,創(chuàng)新點體現(xiàn)在:一,提出了基于競爭的修剪方式;二,提出了一種形式化的“投

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論