面向電子商務的數據挖掘中聚類算法的研究.pdf_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在信息和知識經濟時代伴隨著計算機技術和網絡技術的不斷發(fā)展,企業(yè)紛紛建立自己的商務網站,開展電子商務活動,日積月累網站上生成了大量的與客戶有關的記錄信息,這些信息對企業(yè)來說應該是一筆非常寶貴的財富,如果能得到充分挖掘,發(fā)現背后蘊涵的有用知識,為企業(yè)業(yè)務決策和戰(zhàn)略發(fā)展服務,企業(yè)將會在市場競爭中占據有利地位,應運而生的數據挖掘技術給出了有效的解決方法,它能夠對大量的、不完全的、有噪聲的、模糊的、隨機的數據進行挖掘,提取隱含在其中的、事先不知道

2、但又是潛在有用的信息和知識。而聚類分析是數據挖掘技術中重要的組成部分,從技術角度講,它的主要目的是將數據空間中的數據點劃分到若干個類中。其中,將距離相近的數據點劃分到相同的類中,而將距離較遠的數據點劃分到不同的類中。 目前,已經提出了很多的聚類算法,它們基本上可以分為以下幾種方法:劃分方法、層次方法、基于密度、基于網格和混合方法等方法,這些方法各有優(yōu)缺點。本文通過分析基于網格與基于密度的聚類算法特征,提出了一種基于網格和密度的混

3、合聚類算法,通過分階段聚類并選取代表單元中的種子對象來擴展類,從而減少區(qū)域查詢次數,實現快速聚類。該算法保持了基于密度的聚類算法可以發(fā)現任意形狀的聚類和對噪聲數據不敏感的優(yōu)點,同時保持了基于網格的聚類算法的高效性,適合對大規(guī)模數據的挖掘,并且實驗數據分析驗證了算法的有效性。 在聚類分析領域中另一個長期困擾研究者的典型問題就是聚類參數的設置問題。只有合理的設置聚類參數才能聚類出高質量的聚類結果。然而被聚類的數據集分布情況在聚類前往

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論