分布式關聯(lián)規(guī)則挖掘若干算法研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著數據庫和計算機網絡技術的廣泛應用,許多大型數據庫都以分布式形式存在。如何從分布式數據庫中挖掘有價值的知識是一個具有挑戰(zhàn)性的研究課題。關聯(lián)規(guī)則挖掘是數據挖掘的核心任務之一,它在金融、電信、保險業(yè)、市場營銷、異常監(jiān)測、網絡安全、科學決策等方面具有十分重要的應用價值,因此受到研究人員的高度重視。本文就約束性關聯(lián)規(guī)則分布式挖掘與更新、模糊數量關聯(lián)規(guī)則分布式挖掘、面向XML數據的關聯(lián)規(guī)則分布式挖掘、關聯(lián)規(guī)則的冗余刪除與聚類、關聯(lián)規(guī)則可視化等方

2、面作了較深入的研究。本文的主要研究工作包括以下幾個方面: (1)引入向導集的概念,提出了面向全局.局部模式的分布式約束性頻繁項目集挖掘算法DCAR,包括局部約束性頻繁項目集挖掘算法CLF和全局約束性頻繁項目集挖掘算法CGF,為用戶在分布式數據庫中挖掘感興趣的關聯(lián)規(guī)則提供新的方法。 (2)提出了面向全局.局部模式的約束性頻繁項目集的分布式更新算法DUCAR,包括局部約束性頻繁項目集更新算法UCLF和全局約束性頻繁項目集更新

3、算法UCGF,為在分布式數據庫更新情況下快速挖掘約束性關聯(lián)規(guī)則提供新的途徑。 (3)利用模糊集理論,提出了一種基于聚類構造模糊集及相應隸屬度函數的算法FAM,在此基礎上提出了模糊數量關聯(lián)規(guī)則挖掘算法FAR,考慮在分布式環(huán)境中利用分布式聚類構造全局模糊集和全局隸屬度函數的算法GFAM,實現(xiàn)模糊數量關聯(lián)規(guī)則分布式挖掘。 (4)提出了從XML數據中快速挖掘頻繁模式的增量式算法FreqtTree,對分布式數據庫環(huán)境中面向XML數

4、據的關聯(lián)規(guī)則挖掘問題進行研究。 (5)針對關聯(lián)規(guī)則挖掘中存在大量冗余規(guī)則的問題。提出了關聯(lián)規(guī)則的冗余刪除算法ADRR,關聯(lián)規(guī)則的聚類算法ACAR,從而方便用戶對關聯(lián)規(guī)則進行分析。 (6)提出了關聯(lián)規(guī)則可視化的一種新方法ARVir,利用Java3D技術實現(xiàn)了基于ARVir的關聯(lián)規(guī)則可視化系統(tǒng)原型,方便用戶對結果進行觀察和分析。 (7)實現(xiàn)分布式關聯(lián)規(guī)則挖掘原型系統(tǒng)DDMINER,驗證各個算法的正確性,測試各個算法的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論