基于改進(jìn)模糊聚類的WFSLIM推薦算法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們已經(jīng)從PC時(shí)代進(jìn)入了以智能手機(jī)為代表的移動(dòng)互聯(lián)網(wǎng)聯(lián)網(wǎng)時(shí)代,目前人類每天產(chǎn)生的數(shù)據(jù)量呈指數(shù)在增長(zhǎng)。也有人稱21世紀(jì)是數(shù)據(jù)的時(shí)代(DT)。移動(dòng)互聯(lián)網(wǎng)產(chǎn)生巨大數(shù)據(jù)的同時(shí)也極大的促進(jìn)了微博,推特,淘寶等社交和電商網(wǎng)絡(luò)的火熱發(fā)展。根據(jù)CNNIC報(bào)道,截至2016年底,中國(guó)網(wǎng)民總數(shù)已達(dá)7.1億。如此龐大的互聯(lián)網(wǎng)用戶伴隨而來(lái)的是龐大的數(shù)據(jù)。面對(duì)浩渺的數(shù)據(jù)如何利用用戶產(chǎn)生的行為數(shù)據(jù)來(lái)進(jìn)行高效,經(jīng)濟(jì)的個(gè)性化推薦成了各大平臺(tái)重要的

2、研究問(wèn)題。目前無(wú)論微博等社交網(wǎng)絡(luò)或者淘寶等電子商務(wù)網(wǎng)站現(xiàn)有的推薦系統(tǒng)效果往往都是不太盡如人意。社交和電商的推薦系統(tǒng)主要集中在Top-N的推薦問(wèn)題研究上。好的自動(dòng)化推薦系統(tǒng)可以極大提高用戶在平臺(tái)的活躍度和平臺(tái)收益。
  本文通過(guò)介紹各種傳統(tǒng)推薦算法和其不足之處,比如QQ的基于用戶的協(xié)同過(guò)濾算法就曾出現(xiàn)將前女友推薦給現(xiàn)女友的笑話。當(dāng)然這些缺點(diǎn)還包括推薦準(zhǔn)確率不高,數(shù)據(jù)稀疏,運(yùn)算量龐大等問(wèn)題。提出用基于密度距離加權(quán)的WDFCM聚類算法對(duì)

3、用戶聚類,然后采用綜合考慮用戶之間,項(xiàng)目之間的相關(guān)系數(shù)的WFSLIM推薦算法進(jìn)行推薦,本文主要工作如下:
 ?。?)很多電商和社交平臺(tái)的推薦系統(tǒng)主要采用基于模型的協(xié)同過(guò)濾算法。此算法往往存在著數(shù)據(jù)稀疏性,系統(tǒng)可擴(kuò)展性差以及冷啟動(dòng)等問(wèn)題?;赟VD的推薦算法只是簡(jiǎn)單的對(duì)評(píng)分矩陣進(jìn)行數(shù)學(xué)上的矩陣分解,這僅僅是用戶和商品之間的直接關(guān)系。并沒(méi)有全面考慮到用戶之間,項(xiàng)目之間對(duì)預(yù)測(cè)的影響,對(duì)矩陣分解產(chǎn)生的因子矩陣也沒(méi)有過(guò)多的考慮他們所處在推薦

4、系統(tǒng)的真實(shí)意義。
 ?。?)FCM模糊聚類算法在處理一些特定場(chǎng)景時(shí),其實(shí)驗(yàn)結(jié)果的效果很大取決于聚類參數(shù)和中心點(diǎn)的選取,本文綜合考慮了模糊聚類樣本點(diǎn)的距離和密度對(duì)聚類準(zhǔn)確度的影響,提出了WDFCM算法,通過(guò)實(shí)驗(yàn)驗(yàn)證了算法針對(duì)一些數(shù)據(jù)集,聚類準(zhǔn)確度有了顯著的提高并且減少了聚類的迭代次數(shù)。
 ?。?)本文將基于模型的推薦算法隱語(yǔ)義模型進(jìn)行了拓展,并在拓展模型中考慮了用戶之間,用戶與用戶集之間以及項(xiàng)目之間的相關(guān)系數(shù),針對(duì)傳統(tǒng)的推薦算

5、法準(zhǔn)確率低,數(shù)據(jù)稀疏問(wèn)題,本文提出了先將用戶進(jìn)行改進(jìn)的WDFCM聚類,綜合考慮用戶,用戶集以及項(xiàng)目之間的相關(guān)系數(shù)對(duì)評(píng)分矩陣的影響,然后采用改進(jìn)的WFSLIM推薦算法進(jìn)行推薦。從而達(dá)到降低了評(píng)分矩陣的稀疏度并且提高了模型推薦的準(zhǔn)確率。同時(shí)也在一定條件下降低了算法的運(yùn)行時(shí)間。
 ?。?)隨著電子商務(wù)網(wǎng)站的用戶和物品數(shù)據(jù)的飛速增加,傳統(tǒng)的推薦算法平臺(tái)在處理海量數(shù)據(jù)時(shí)已經(jīng)明顯性能不足,本文最后在基于Hadoop大數(shù)據(jù)平臺(tái)上,實(shí)現(xiàn)了推薦系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論