關聯(lián)規(guī)則的衡量標準及其算法研究.pdf_第1頁
已閱讀1頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,數據挖掘受到人工智能與數據庫界的廣泛關注。關聯(lián)規(guī)則挖掘是數據挖掘中重要的研究課題。關聯(lián)規(guī)則的主要研究對象是交易數據庫,其主要目標就是發(fā)現(xiàn)交易數據庫中交易項目之間是否存在某些關聯(lián)關系。 目前常用的關聯(lián)規(guī)則的衡量標準是支持度(support)和置信度(confidence)。用現(xiàn)有的衡量標準生成關聯(lián)規(guī)則可能會產生大量冗余的、虛假的關聯(lián)規(guī)則。 當前對關聯(lián)規(guī)則的形式化定義是采用X(→)Y的模式,其中X為前提,Y作為后繼。

2、而實際的商品交易中我們往往只知道商品是否被同時購買,而不知道究竟是X的購買導致了Y的購買還是Y的購買導致了X的購買。即X和Y之間不存在前提和后繼的關系。因此X(→)Y的模式與商品交易的實際購買情況不符,可能會導致矛盾規(guī)則的產生。 本文首先對經典的算法如Apriori、FP_growth等算法進行介紹和深入細致的分析,對比其性能的優(yōu)劣,給出了它們的一些改進形式。然后研究了關聯(lián)規(guī)則衡量標準及現(xiàn)有的若干改進方法,針對現(xiàn)有關聯(lián)規(guī)則衡量標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論