融合上下文信息的混合協(xié)同過濾推薦算法研究.pdf_第1頁
已閱讀1頁,還剩126頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著計(jì)算機(jī)的普及和網(wǎng)絡(luò)技術(shù)的發(fā)展,互聯(lián)網(wǎng)信息服務(wù)已經(jīng)逐漸滲透到人們生活的方方面面,正在從根本上改變?nèi)藗儌鹘y(tǒng)的生活方式。特別是近年來,智能手機(jī)、平板電腦等移動(dòng)設(shè)備的廣泛使用以及微信、微博等移動(dòng)應(yīng)用的興起,突破了傳統(tǒng)PC端互聯(lián)網(wǎng)訪問的時(shí)間、空間等限制,使得人們現(xiàn)在可以更加方便、自由、快捷地通過互聯(lián)網(wǎng)獲取和分享信息。然而,伴隨著互聯(lián)網(wǎng)信息服務(wù)的蓬勃發(fā)展,其信息資源規(guī)模也發(fā)生了爆發(fā)式增長。此時(shí),人們從互聯(lián)網(wǎng)中找到自己想要的信息變的愈發(fā)困難,引起

2、了所謂的信息過載問題。在此背景下,推薦系統(tǒng)被提出并且成為解決該問題最有效的技術(shù)之一。
  目前,協(xié)同過濾是推薦系統(tǒng)中應(yīng)用最廣泛、最成功的技術(shù)。它僅需少量“用戶-物品”之間的歷史評分?jǐn)?shù)據(jù)就可以快速構(gòu)建一個(gè)可用的系統(tǒng)來預(yù)測用戶的潛在信息需求,具有簡單、易用、精度高等優(yōu)點(diǎn)。然而,隨著數(shù)據(jù)規(guī)模越來越龐大、數(shù)據(jù)類型越來越豐富、應(yīng)用環(huán)境越來越復(fù)雜,傳統(tǒng)協(xié)同過濾算法正面臨更加嚴(yán)峻的數(shù)據(jù)稀疏性、冷啟動(dòng)、可擴(kuò)展性、可解釋性等問題。最近,一些研究工作

3、嘗試把上下文信息融合到協(xié)同過濾算法,取得了一定的性能提升。從這些初步嘗試可以看出,上下文信息與用戶興趣有緊密聯(lián)系,它們的引入有助于提高預(yù)測精度和用戶滿意度,因此融合上下文信息對于改進(jìn)協(xié)同過濾算法具有重要意義。鑒于此,本文對協(xié)同過濾算法進(jìn)行了系統(tǒng)分析,對上下文信息進(jìn)行了更加深入的探討,進(jìn)而針對不同上下文的歷史評分?jǐn)?shù)據(jù),設(shè)計(jì)了多種混合協(xié)同過濾算法能夠更高效地利用上下文信息解決當(dāng)前推薦系統(tǒng)面臨的問題。
  本文主要工作和創(chuàng)新如下:

4、>  1.融合物品分類結(jié)構(gòu)和內(nèi)容信息的協(xié)同過濾算法研究。目前,大部分關(guān)于可擴(kuò)展性和冷啟動(dòng)問題的研究主要針對用戶進(jìn)行展開,而很少關(guān)注系統(tǒng)中動(dòng)態(tài)更新的物品,尤其對大規(guī)模物品缺乏可擴(kuò)展性,對新物品也不能取得令人滿意的推薦結(jié)果。本研究發(fā)現(xiàn),在有明確物品分類的前提下,同種物品之間一定會(huì)存在一些相同的內(nèi)容屬性或者其他一些潛在特征,因此用戶對同種物品應(yīng)該具有相似興趣?;诖税l(fā)現(xiàn),本研究從物品關(guān)系以及物品特征入手,利用物品分類信息、物品內(nèi)容信息(關(guān)鍵字

5、)等上下文提出一種逐步優(yōu)化用戶興趣的分層協(xié)同過濾算法。分析顯示該算法對大規(guī)模物品有可擴(kuò)展性,還能解決新物品的冷啟動(dòng)問題,并且真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明該算法在不同比例稀疏數(shù)據(jù)情況下可以取得較高的預(yù)測精度,而且針對新物品具有較好的冷啟動(dòng)預(yù)測能力。
  2.融合用戶-物品內(nèi)容上下文關(guān)聯(lián)信息的協(xié)同過濾算法研究。在之前的算法中,雖然物品分類信息有助于利用物品相似性優(yōu)化用戶興趣,但是分類需要事先構(gòu)建,這種較高的數(shù)據(jù)要求限制了該算法的適用范圍

6、,另外該算法不能對用戶進(jìn)行擴(kuò)展,也不能解決新用戶的冷啟動(dòng)問題。為了設(shè)計(jì)更通用可擴(kuò)展的算法,本研究轉(zhuǎn)而關(guān)注內(nèi)容上下文,也就是用戶內(nèi)容信息(標(biāo)簽)和物品內(nèi)容信息(關(guān)鍵字)。用戶-物品之間的歷史評分?jǐn)?shù)據(jù)為它們的內(nèi)容上下文建立了關(guān)聯(lián)關(guān)系?;诖税l(fā)現(xiàn),本研究從內(nèi)容上下文入手,將協(xié)同過濾與基于內(nèi)容的推薦算法相結(jié)合,提出一種根據(jù)內(nèi)容相似性產(chǎn)生預(yù)測結(jié)果的間接協(xié)同過濾算法。分析顯示該算法具有較強(qiáng)的可解釋性和可擴(kuò)展性,并且真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明該算法在

7、不同比例稀疏數(shù)據(jù)情況下可以取得較高的預(yù)測精度,而且針對新用戶和新物品都具有較好的冷啟動(dòng)預(yù)測能力。
  3.融合子群組間潛在共享信息的協(xié)同過濾算法研究。除了直接將上下文信息與推薦算法進(jìn)行耦合外,最近出現(xiàn)了一類基于子群組的改進(jìn)算法,主要思想是根據(jù)上下文信息,將整個(gè)數(shù)據(jù)集劃分到不同子群組,然后在這些子群組上分別運(yùn)行協(xié)同過濾算法產(chǎn)生各自的預(yù)測結(jié)果。但是不均衡稀疏數(shù)據(jù)會(huì)造成子群組上協(xié)同過濾結(jié)果不穩(wěn)定的問題。對這些子群組分析后,可以發(fā)現(xiàn)它們所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論