基于粒計算的聚類算法研究.pdf_第1頁
已閱讀1頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著網絡技術的發(fā)展與普及,大量數據充斥人們眼球,人們每天都要面對海量數據。基本的數據存儲與讀取功能已經不能滿足需求,人們希望在大量數據集中尋找有用信息。數據挖掘正是從大量有效的數據中發(fā)現隱藏信息的一門有效技術。聚類是數據挖掘中的一個主要研究方向,其通過類內事物具有相似性、類間事物具有相異性來發(fā)現事物的內在規(guī)律。
  聚類是一種無監(jiān)督學習方法,其本質是論域上的等價劃分,而這種等價劃分的結果是等價類內樣本集相似度大于給定閾值,而等價類

2、之間樣本集則小于閾值。傳統(tǒng)的聚類算法很難處理模糊、不確定信息,對異常信息不敏感,算法不夠穩(wěn)定,過度依賴輸入參數,且在處理大數據集上運行緩慢。針對聚類算法的上述缺點,文章結合粒計算的三大模型模糊集、粗糙集模型和商空間模型理論,提出融合模型聚類算法。
  本文首先介紹粒計算基本概念,分析粒計算單一模型下的聚類算法,及模糊商空間聚類算法和模糊粗糙聚類算法。粒計算融合模型聚類算法是在原有粒計算模型聚類算法基礎上,結合各模型優(yōu)點而成。即模糊

3、聚類算法能夠處理模糊信息,使得聚類結果同實際更加吻合;粗糙集聚類算法能夠從數據本身求解參數,使得聚類結果更加精確,算法更加穩(wěn)定;商空間聚類算法能夠從不同粒度大小,求解不同聚類結果,從中選擇最優(yōu)聚類結果,這同人類求解問題過程是一致的。
  為了使算法能夠處理混合屬性數據,本文使用統(tǒng)一相異度公式計算模糊商空間的距離空間。使用陰影集理論計算每個類簇的閾值,根據閾值大小計算每個類簇的正域及邊界域,采用近似集權值方法計算類簇中心,作為下一次

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論