基于用戶興趣聚類的協(xié)同過濾算法的研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、互聯(lián)網(wǎng)越來越深入的融入人們的生活,其中產(chǎn)生的信息大大超過了人們處理信息、利用信息的能力范圍,因此推薦系統(tǒng)的使用越來越受到重視。其中應(yīng)用最多的協(xié)同過濾推薦技術(shù)得到了廣泛的應(yīng)用和發(fā)展?,F(xiàn)有的單純協(xié)同過濾算法給出的推薦結(jié)果已經(jīng)不能滿足廣大用戶的需求。很多人考慮到了挖掘用戶的興趣愛好,給出更加符合用戶喜好的推薦結(jié)果。這類推薦過程是將有相同興趣愛好的用戶聚為一類,然后再根據(jù)和目標(biāo)用戶有相同興趣愛好的用戶的購買情況,給目標(biāo)用戶推薦他可能購買的商品。

2、
  這種方式雖然也考慮了用戶的興趣偏好,但是它將用戶所有的評分記錄看作一個興趣整體。然而現(xiàn)實的情況是用戶在整個評分信息中可能包含不同興趣圈的商品并且用戶在不同的時間段內(nèi)關(guān)注的興趣圈也會不同,這里的興趣圈代表某些商品組成的一個聚類,用戶對其中某個商品感興趣的時候很可能會對其中其他的商品感興趣。因此本文提出的推薦系統(tǒng)考慮用戶興趣的時候,不是根據(jù)興趣將用戶聚類,而是根據(jù)用戶的評分記錄獲取潛在的大多數(shù)用戶可能感興趣的一些興趣圈,進而計算

3、每個興趣圈的中心來代表每個興趣中心,然后根據(jù)用戶最近的評分記錄和興趣圈中心的相似性判斷用戶對每個興趣圈感興趣的程度,最后產(chǎn)生推薦結(jié)果。
  為了獲取上面的興趣圈中心,需要將原始的用戶操作記錄轉(zhuǎn)化為適合聚類算法使用的評分記錄。為了從用戶操作的歷史記錄中提取用戶對各個興趣圈商品潛在的評分信息,需要先將用戶的操作類型轉(zhuǎn)換成用戶對商品的評分。然后將用戶在同一天對同一商品的評分進行累加合并,這個過程能夠減少數(shù)據(jù)量,降低后面操作的復(fù)雜度。接著

4、根據(jù)用戶評分的時間(具體到天)將用戶在每個連續(xù)的時間段內(nèi)評分的商品歸類到一個興趣圈,并將興趣圈內(nèi)相同商品的評分信息進行合并。最后將前面獲得的興趣圈內(nèi)商品的評分信息轉(zhuǎn)化為一條興趣圈的評分記錄。下面對所有的興趣圈評分記錄進行聚類,使用聚類中心來代表每個興趣圈。
  本文給出的推薦系統(tǒng)使用的聚類算法是蟻群聚類算法,這種聚類方式具有正向反饋和獲取全局最優(yōu)解的特點。另外為了加快聚類算法收斂,本文使用K-means聚類算法來產(chǎn)生蟻群聚類算法的

5、初始聚類中心。這種方式結(jié)合了兩者的優(yōu)點,最終使得算法更加準(zhǔn)確、高效。獲得了興趣圈中心后,計算用戶最近評分記錄和各個興趣圈中心的相似性,再使用協(xié)同過濾算法產(chǎn)生用戶的推薦列表。
  最后本文設(shè)計實驗來驗證提出算法的性能以及運行特點。實驗結(jié)果顯示,基于用戶興趣聚類的協(xié)同過濾算法性能遠好于傳統(tǒng)基于用戶聚類的協(xié)同過濾算法;雖然基于蟻群聚類算法的綜合評價指數(shù)F1對于基于K-means聚類算法沒有明顯提高,不過可以驗證在初始聚類中心合適的情況下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論