2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、分類和關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域的兩個重要研究方向,二者都已經(jīng)取得了比較完善的研究成果。關(guān)聯(lián)分類作為一個較新的數(shù)據(jù)挖掘課題使用關(guān)聯(lián)規(guī)則挖掘構(gòu)建分類系統(tǒng)。關(guān)聯(lián)分類算法使用規(guī)則發(fā)現(xiàn)方法從分類數(shù)據(jù)集中抽取分類規(guī)則,并通過一定的剪枝手段對規(guī)則進行剪枝,然后按照一定的規(guī)則形成分類器。
   由于挖掘出了數(shù)據(jù)屬性和類標簽之間的強關(guān)聯(lián),關(guān)聯(lián)分類器往往可以達到很高的分類精確度。然而,在規(guī)則產(chǎn)生階段,關(guān)聯(lián)分類算法會產(chǎn)生大量的規(guī)則,在對規(guī)則的處理過

2、程中,算法會需要極大的系統(tǒng)開銷。因此,小規(guī)模的規(guī)則集以及有效的規(guī)則剪枝方法對于關(guān)聯(lián)分類算法十分必要。本文提出的基于ECLAT的關(guān)聯(lián)分類算法結(jié)合了壓縮規(guī)則集的性質(zhì)和ECLAT方法自身的特點,在挖掘類關(guān)聯(lián)規(guī)則的同時引入剪枝策略,在產(chǎn)生規(guī)則的過程中對新產(chǎn)生的規(guī)則項進行置信度檢測,及時刪除冗余的規(guī)則和等價類,然后再對產(chǎn)生的規(guī)則集進行覆蓋剪枝。實驗表明,這種方式可以在極大地壓縮初始規(guī)則集的規(guī)則數(shù)量,極大地縮短了算法運行時間并且降低了系統(tǒng)開銷。

3、r>   在關(guān)聯(lián)規(guī)則挖掘和關(guān)聯(lián)分類算法中,興趣度被引入用來提取規(guī)則以降低規(guī)則的數(shù)量。本文對目前比較常見的興趣度進行了總結(jié),并通過實驗比較了不同興趣度對于不同數(shù)據(jù)集的分類效果。實驗結(jié)果表明興趣度可減少規(guī)則的數(shù)量但沒有一個興趣度對于所有數(shù)據(jù)集都能夠達到最優(yōu)的分類效果。
   最后,本文將關(guān)聯(lián)分類應(yīng)用于電子商務(wù)推薦系統(tǒng)中。在P2P站點北洋園PT中,推薦算法使用關(guān)聯(lián)分類技術(shù),從用戶的下載記錄中學(xué)習(xí)分類模型,構(gòu)建關(guān)聯(lián)分類器,并將生成的關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論