2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩134頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、個(gè)性化信息檢索針對(duì)用戶個(gè)人興趣偏好優(yōu)化文檔排序,被認(rèn)為是現(xiàn)有搜索引擎改善用戶檢索體驗(yàn)的一種有效途徑。個(gè)性化信息檢索以用戶為中心提供有針對(duì)性的檢索結(jié)果,因此不僅考慮查詢和文檔的匹配度,還考慮文檔和用戶興趣偏好的匹配度。用戶歷史包含用戶豐富的信息,是獲取用戶興趣偏好的最佳途徑,成為個(gè)性化信息檢索研究的焦點(diǎn)。為了探索不同的用戶歷史在檢索中的作用,本文量化分析了用戶歷史與檢索結(jié)果的相關(guān)性,探討了如何利用短期歷史、長期歷史、以及綜合利用二者以提高

2、個(gè)性化檢索性能的方法。
  1)針對(duì)用戶歷史與檢索結(jié)果的關(guān)系,量化分析了用戶長短期歷史與用戶查詢和點(diǎn)擊的相關(guān)性。本文采用向量空間模型框架,從以下四個(gè)方面分析了用戶長短期歷史與查詢和點(diǎn)擊的關(guān)系:相關(guān)比例、相關(guān)程度、是否存在線性關(guān)系和具體內(nèi)容上的差異。分析發(fā)現(xiàn)79.55%的查詢可以從用戶歷史中獲取相關(guān)信息,其中短期歷史覆蓋的比例較大(71.23%),相關(guān)程度也較高;而針對(duì)同一個(gè)查詢,不同的用戶歷史所提供的相關(guān)信息不盡相同,彼此的結(jié)合有

3、可能進(jìn)一步提高檢索性能。
  2)針對(duì)如何合理利用短期歷史的問題,提出了一種短期歷史權(quán)重自適應(yīng)的個(gè)性化檢索方法。為了合理分配短期歷史權(quán)重,本文以短期歷史和當(dāng)前查詢的相關(guān)強(qiáng)度為核心依據(jù),以當(dāng)前查詢、短期歷史查詢、短期歷史點(diǎn)擊三個(gè)維度上的用戶行為特征為線索,建立了 SVM回歸模型對(duì)短期歷史的權(quán)重進(jìn)行預(yù)測。實(shí)驗(yàn)表明,該方法能夠根據(jù)具體的檢索環(huán)境為每個(gè)查詢的短期歷史動(dòng)態(tài)分配權(quán)重,有效提升了個(gè)性化檢索性能。
  3)針對(duì)如何有效利用長

4、期歷史的問題,本文引入增量層次聚類算法對(duì)長期興趣建模,并在此基礎(chǔ)上建立新的查詢模型。長期歷史內(nèi)容豐富但主題相對(duì)分散,并隨著用戶的使用不斷積累更新,因此長期歷史中包含很多與當(dāng)前查詢無關(guān)的內(nèi)容。針對(duì)該問題,本文采用增量層次聚類算法漸進(jìn)地構(gòu)建用戶長期興趣樹,并使用對(duì)當(dāng)前檢索有最大幫助的興趣簇估計(jì)長期興趣模型,從而對(duì)用戶查詢進(jìn)行有益補(bǔ)充。實(shí)驗(yàn)證明,基于長期歷史增量層次聚類的個(gè)性化檢索方法顯著優(yōu)于現(xiàn)有基于長期歷史的檢索方法,在一定程度上解決了具有

5、多樣性和動(dòng)態(tài)性的長期歷史的利用問題,改善了個(gè)性化檢索性能。
  4)在上述研究的基礎(chǔ)上,設(shè)計(jì)了一種基于用戶長短期歷史融合的個(gè)性化檢索框架。用戶長短期歷史對(duì)檢索結(jié)果的作用不同,本文的模型將二者的不同作用綜合作用于查詢和文檔,一方面根據(jù)長短期歷史更準(zhǔn)確地估計(jì)用戶查詢,另一方面考慮了文檔相對(duì)于用戶的重要性差異。實(shí)驗(yàn)中全面比較了不同用戶歷史的各種組合,結(jié)果表明長短期歷史融合作用于查詢的效果優(yōu)于只使用一種歷史的情況,而同時(shí)作用于查詢和文檔可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論