耦合社交網(wǎng)絡(luò)環(huán)境下基于擴(kuò)散過(guò)程的推薦算法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩115頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、互聯(lián)網(wǎng)的快速發(fā)展給我們的日常生活帶來(lái)了很大的影響,大大改變了我們獲取信息的方式。它為我們提供了豐富的在線內(nèi)容,使得我們需要耗費(fèi)大量的時(shí)間在海量信息中瀏覽并尋找所需要的信息,這通常被稱為“信息過(guò)載”問(wèn)題。為了克服“信息過(guò)載”問(wèn)題,國(guó)內(nèi)外學(xué)者發(fā)明了很多信息過(guò)濾技術(shù),其中最具代表性的是搜索引擎和推薦系統(tǒng)。搜索引擎能夠根據(jù)用戶提供的關(guān)鍵字返回與之相關(guān)性最高的網(wǎng)頁(yè),雖然已被廣泛應(yīng)用,但它仍然存在兩個(gè)明顯的不足。首先,對(duì)于經(jīng)驗(yàn)不夠豐富的用戶來(lái)說(shuō)提供

2、準(zhǔn)確的搜索關(guān)鍵字是很困難的;其次,對(duì)于給定的關(guān)鍵字搜索引擎總是返回非個(gè)性化的搜索結(jié)果。推薦系統(tǒng)則利用用戶的歷史選擇信息、評(píng)價(jià)信息等幫助用戶尋找與之相關(guān)聯(lián)、感興趣和有用的信息。推薦系統(tǒng)無(wú)需用戶輸入關(guān)鍵字且返回個(gè)性化的推薦結(jié)果,克服了搜索引擎所存在的不足。目前,推薦算法已經(jīng)在電子商務(wù)、計(jì)算廣告、在線教育和在線醫(yī)療等領(lǐng)域得到了廣泛應(yīng)用并帶來(lái)了巨大的商業(yè)價(jià)值。
  在大多數(shù)實(shí)際應(yīng)用中用戶的歷史行為信息是非常稀疏的,由于缺乏足夠的用戶歷史數(shù)

3、據(jù),推薦系統(tǒng)通常很難給出精準(zhǔn)的推薦,這通常被稱為數(shù)據(jù)稀疏性問(wèn)題,它長(zhǎng)期以來(lái)一直困擾著推薦系統(tǒng)。社會(huì)影響力在產(chǎn)品營(yíng)銷中發(fā)揮著極其重要的作用,然而傳統(tǒng)的推薦系統(tǒng)卻沒(méi)有將它納入到推薦框架中。隨著在線社交網(wǎng)絡(luò)的快速崛起,基于社交網(wǎng)絡(luò)的推薦已經(jīng)變成一種有重要意義且富有成效的推薦方式。
  現(xiàn)有的基于社交網(wǎng)絡(luò)信息的個(gè)性化推薦算法各有優(yōu)勢(shì)與不足,但它們的共同特點(diǎn)是幾乎都需要評(píng)分、標(biāo)簽或用戶的社會(huì)屬性等額外信息,而這些附加信息并不容易獲取,而且其

4、真實(shí)性也得不到保證。近年來(lái),由于只關(guān)注用戶的選擇信息而不需要標(biāo)簽或評(píng)分等額外信息,基于復(fù)雜網(wǎng)絡(luò)尤其是二部圖的推薦算法受到越來(lái)越多的學(xué)者關(guān)注。該類算法借鑒物質(zhì)擴(kuò)散與熱傳導(dǎo)的思想,將推薦系統(tǒng)輸入數(shù)據(jù)抽象為復(fù)雜網(wǎng)絡(luò)模型,在算法復(fù)雜性上低于經(jīng)典的協(xié)同過(guò)濾算法,并且具有較好的可擴(kuò)展性。然而該類算法至今未能有效地融入社交網(wǎng)絡(luò)信息,其推薦精度存在較大的提升空間。
  針對(duì)已有研究工作存在的問(wèn)題和挑戰(zhàn),本文對(duì)利用擴(kuò)散過(guò)程融合社交網(wǎng)絡(luò)信息的推薦算法

5、進(jìn)行了深入的研究,主要包括融合社交網(wǎng)絡(luò)信息的物質(zhì)擴(kuò)散推薦算法、考慮用戶間信任傳遞的物質(zhì)擴(kuò)散推薦算法、既融合社交網(wǎng)絡(luò)信息又在擴(kuò)散過(guò)程中將物質(zhì)擴(kuò)散和熱傳導(dǎo)相結(jié)合的推薦算法等。本文的主要工作和貢獻(xiàn)如下:
  (1)提出了融合社交網(wǎng)絡(luò)信息的物質(zhì)擴(kuò)散推薦算法。該算法利用物質(zhì)擴(kuò)散過(guò)程將社交網(wǎng)絡(luò)信息有機(jī)地融入到推薦過(guò)程中,通過(guò)一個(gè)調(diào)節(jié)參數(shù)控制社交網(wǎng)絡(luò)信息的參與程度。實(shí)驗(yàn)結(jié)果表明,當(dāng)用戶選擇的item很少時(shí),社交網(wǎng)絡(luò)信息在推薦過(guò)程中發(fā)揮了極其重要

6、的作用。在數(shù)據(jù)特別稀疏的情況下,該算法較傳統(tǒng)的物質(zhì)擴(kuò)散和混合算法在推薦準(zhǔn)確度方面提高的幅度非常大,這一方面說(shuō)明該算法特別適用于用戶-item二部圖相對(duì)稀疏而社交網(wǎng)絡(luò)相對(duì)稠密的兩層耦合網(wǎng)絡(luò),另一方面也顯示了該算法在緩解數(shù)據(jù)稀疏性問(wèn)題上的能力。對(duì)于數(shù)據(jù)稀疏性問(wèn)題的極端情況冷啟動(dòng)問(wèn)題,實(shí)驗(yàn)結(jié)果表明該算法較基于item流行度排序的算法在推薦準(zhǔn)確性、多樣性和新穎性等方面均有較大幅度的改進(jìn),該方法為緩解冷啟動(dòng)問(wèn)題提供了新的思路。
  (2)提

7、出了一種考慮用戶間信任關(guān)系傳遞的推薦算法。該算法利用物質(zhì)擴(kuò)散過(guò)程將社交網(wǎng)絡(luò)信息有機(jī)地融入到推薦過(guò)程之中,不僅利用目標(biāo)用戶直接好友的用戶-item選擇信息而且還借助了目標(biāo)用戶的二階好友的用戶-item選擇信息。實(shí)驗(yàn)結(jié)果表明,在目標(biāo)用戶選擇的item特別少時(shí),該算法的推薦精度較傳統(tǒng)的物質(zhì)擴(kuò)散算法得到了較大幅度的提升。而在目標(biāo)用戶選擇的item特別多時(shí),該算法能夠在一定程度上改進(jìn)傳統(tǒng)物質(zhì)擴(kuò)散算法的推薦多樣性。
  (3)提出了一個(gè)在推薦

8、過(guò)程中利用物質(zhì)擴(kuò)散和熱傳導(dǎo)相結(jié)合的擴(kuò)散過(guò)程有機(jī)地融入社交網(wǎng)絡(luò)信息的推薦算法,該算法利用社交網(wǎng)絡(luò)信息和用戶-item歷史選擇信息、擴(kuò)散過(guò)程采用物質(zhì)擴(kuò)散和熱傳導(dǎo)相結(jié)合的方式為用戶提供個(gè)性化推薦。傳統(tǒng)的物質(zhì)擴(kuò)散算法、熱傳導(dǎo)算法、混合算法以及本文提出的融合社交網(wǎng)絡(luò)信息的物質(zhì)擴(kuò)散推薦算法都是該算法的特例。實(shí)驗(yàn)結(jié)果表明,由于資源傳輸方式的改變,該算法幾乎在所有評(píng)價(jià)指標(biāo)方面都優(yōu)于本文提出的融合社交網(wǎng)絡(luò)信息的物質(zhì)擴(kuò)散推薦算法。在推薦精度方面,該算法較物

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論