基于主題的電子商務(wù)推薦方法研究.pdf_第1頁
已閱讀1頁,還剩132頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著互聯(lián)網(wǎng)的普及和電子商務(wù)的發(fā)展,電子商務(wù)系統(tǒng)在為用戶提供越來越多選擇的同時,其結(jié)構(gòu)也變得更加復(fù)雜,用戶經(jīng)常會迷失在大量的商品信息空間中,無法順利找到自己需要的產(chǎn)品。電子商務(wù)推薦系統(tǒng)直接與用戶交互,模擬商店銷售人員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。在日趨激烈的競爭環(huán)境下,電子商務(wù)推薦系統(tǒng)能有效保留客戶、防止用戶流失,提高電子商務(wù)系統(tǒng)的銷售。
  然而隨著電子商務(wù)系統(tǒng)規(guī)模的進(jìn)一步擴(kuò)大,電子商務(wù)推薦也面臨

2、一系列挑戰(zhàn),由于用戶興趣主題分類中的特征較多,因此在商品語料中,往往存在一些特征僅在某一些用戶主題類別中出現(xiàn),而在其它的用戶主題中并不出現(xiàn),即數(shù)據(jù)稀疏問題,影響了推薦系統(tǒng)的精度;推薦方法的冷開始問題,即如果一個新項目沒有人去評價它,或都不去評價它,則這個項目得不到推薦,推薦系統(tǒng)就失去了作用;只注重外延的推薦方法的優(yōu)化,較少考慮產(chǎn)品自身的語義信息等等。對此本文以用戶感興趣的信息主題來刻畫用戶的興趣特征,對電子商務(wù)推薦系統(tǒng)中主題分類技術(shù)、概

3、念相關(guān)聚類方法、語義信息處理方法以及推薦系統(tǒng)體系結(jié)構(gòu)等關(guān)鍵技術(shù)進(jìn)行了深入研究和探索,以提高電子商務(wù)推薦方法的性能。本文研究的主要內(nèi)容包括:
  第一,基于主題的推薦系統(tǒng)需要分析資源內(nèi)容信息,通過比較資源是否跟用戶用戶檔案一致決定是否進(jìn)行推薦,它需要從資源中進(jìn)行特征提取。由于用戶興趣主題分類中的特征較多,因此在商品語料中,往往存在一些特征僅在某一些用戶主題類別中出現(xiàn),而在其它的用戶主題中并不出現(xiàn),進(jìn)而引發(fā)了數(shù)據(jù)稀疏問題,嚴(yán)重影響了推

4、薦精度。對此,引入統(tǒng)計語言模型中Good-Turing算法直接對特征詞的條件概率平滑,采用“折扣再分配”策略對統(tǒng)計參數(shù)進(jìn)行重新估值,計算缺失特征詞的補(bǔ)償概率。此外,又將貝葉斯主題推薦中的類別與特征詞看作是Bigram語言模型中的二元對,并引入絕對折扣(Absolute Discount)平滑算法針對二元對進(jìn)行平滑,來克服數(shù)據(jù)稀疏問題帶來的影響。
  第二,由于表達(dá)方式的多樣性,即使同一商品概念如商品名稱及屬性名稱也可能有不同的表達(dá)

5、形式,不同概念也可能存在部分-整體、值-屬性等多種相關(guān)關(guān)系。而相關(guān)研究中一般采用基于外延的推薦方法,僅利用商品的外在特征等統(tǒng)計信息,使得推薦質(zhì)量受到影響。對此,以知網(wǎng)作為商品概念相關(guān)知識源,擴(kuò)展推薦中的概念空間,利用詞概念相關(guān)計算模型來計算用戶的興趣主題,并與統(tǒng)計信息進(jìn)行有效融合,以提升商品推薦對概念的敏感能力。本文以融入自組織映射網(wǎng)絡(luò)為例,對融合概念相關(guān)知識的方法作以深入探討。
  第三,在第二部分提出融合概念知識的基礎(chǔ)之上,進(jìn)

6、一步對推薦對象的語義信息構(gòu)造方法進(jìn)行研究,構(gòu)建推薦概念知識庫。對領(lǐng)域術(shù)語候選計算及領(lǐng)域術(shù)語抽取,商品同義詞詞典的構(gòu)造方法以及相關(guān)詞構(gòu)造方法進(jìn)行研究。領(lǐng)域術(shù)語抽取用于獲取推薦系統(tǒng)原來未知的語義單元,新的專業(yè)術(shù)語等。當(dāng)新的商品、新的詞匯出現(xiàn)時,推薦系統(tǒng)應(yīng)該具備識別這些新術(shù)語的能力,此外本文探討基于詞矢量空間計算相似度的方法以及基于平均互信息計算相關(guān)詞,這些不僅可用于概念相關(guān)知識推薦中,還可用于用戶查詢意圖擴(kuò)展中。
  第四,不同的用戶

7、對同樣的問題的理解不盡相同,理解的粒度也可能不同。本文由此對用戶個人偏好的異質(zhì)性問題研究,提出基于協(xié)同的擴(kuò)展偏聚類方法,挖掘隱藏在主題內(nèi)部的用戶偏好。提出基于協(xié)同的擴(kuò)展偏聚類方法,將用戶模型與用戶對自身信息需求(興趣愛好、信息訪問方式及思維方式)的組織形式相關(guān)聯(lián),以用戶個性化的主題分類體系、主題分類標(biāo)識為框架,采用協(xié)同過濾方法擴(kuò)展同類偏好數(shù)量,同時其用戶端的層次化信息組織管理,來克服以權(quán)重方式刻畫用戶興趣的模型可能導(dǎo)致的偏置現(xiàn)象。

8、>  第五,對主題的電子商務(wù)推薦系統(tǒng)設(shè)計與相關(guān)應(yīng)用進(jìn)行研究,提出一種“通用推薦”和“個性化推薦”相結(jié)合的主題推薦系統(tǒng)框架,其綜合前幾項研究成果,同時由于在推薦初期采用通用推薦可克服冷開始問題,即如果一個新項目沒有人去評價它,或都不去評價它,則這個項目肯定得不到推薦,推薦系統(tǒng)就失去了作用。系統(tǒng)利用構(gòu)建用戶興趣模型來全面、準(zhǔn)確地描述用戶的購買意圖,對主題搜索返回的結(jié)果進(jìn)行過濾、排序與歸類,提供推薦。在論文稿件領(lǐng)域推薦的任務(wù)中,著重研究稿件的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論