面向數(shù)字圖書館的協(xié)同過濾推薦算法的研究.pdf_第1頁
已閱讀1頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、由于數(shù)字圖書館具有豐富的信息資源和便捷的操作性,在近幾年內(nèi)其得以快速的普及和發(fā)展。當(dāng)前比較成功的數(shù)字圖書館系統(tǒng)有ACM數(shù)字圖書館,中國知網(wǎng)(CNKI)等,但是它們面臨著用戶無法快速找到自己所需資源的問題,個性化的推薦技術(shù)是解決這一問題的最好方法。個性化推薦技術(shù)在數(shù)字圖書館服務(wù)中的應(yīng)用,不僅為用戶提供了個性化的內(nèi)容,簡化了用戶操作,也提升數(shù)字圖書館的資源利用效率,達(dá)到了雙方的共贏。推薦技術(shù)是本論文的主要研究內(nèi)容。
  在眾多的推薦技

2、術(shù)中,協(xié)同過濾推薦技術(shù)是個性化推薦技術(shù)中被廣泛使用的技術(shù)之一,論文主要討論的是基于用戶的協(xié)同過濾推薦技術(shù)。協(xié)同過濾技術(shù)面臨的諸多問題中,數(shù)據(jù)稀疏性問題是最為嚴(yán)峻的。該問題會導(dǎo)致傳統(tǒng)算法無法準(zhǔn)確計算用戶間的相似度,進(jìn)而影響最終的推薦效果。雖然傳統(tǒng)的評分矩陣缺省值填充方法可以緩解這一問題,但效果并不是非常理想。數(shù)據(jù)稀疏性問題也是本論文的主要研究的內(nèi)容之一。
  本論文的主要研究內(nèi)容有:對于數(shù)據(jù)稀疏性問題,論文中提出了改進(jìn)的項目評分預(yù)測

3、方法,即將用戶間評分項目的并集作為用戶間的共同評分項,利用項目間的相似度預(yù)測用戶對未評分項目的評分值,該方法可以更準(zhǔn)確地計算用戶間的相似度;與此同時,論文對傳統(tǒng)的皮爾森相關(guān)系數(shù)公式進(jìn)行了改進(jìn),提出了評價系數(shù)的概念,以更加準(zhǔn)確地衡量不同熱門程度間用戶的真實相似度;最后,論文對傳統(tǒng)預(yù)測評分公式進(jìn)行了改進(jìn),通過利用基于標(biāo)簽的方法和基于項目的協(xié)同過濾方法計算項目間的相似度,來預(yù)測預(yù)分公式中鄰居集用戶對未評分目標(biāo)項目的評分值。
  在數(shù)據(jù)集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論