社會標(biāo)注系統(tǒng)中標(biāo)簽推薦方法研究.pdf_第1頁
已閱讀1頁,還剩147頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Web2.0開放的信息發(fā)布方式一方面極大地簡化了信息的發(fā)布過程,令更多的信息可以更自由的在互聯(lián)網(wǎng)上傳播,另一方面也為如何有效的組織這些信息帶來了問題。社會標(biāo)注系統(tǒng)使用基于純文本標(biāo)簽的方法分類信息,其簡單性與便捷性獲得了用戶的認(rèn)可,并成為了Web2.0時代最為重要的信息組織方式。然而受到其不受控制的本質(zhì)的影響,社會標(biāo)注系統(tǒng)的標(biāo)注結(jié)果普遍存在著分類視角不一致、分類詞匯不一致、分類結(jié)果不一致、分類結(jié)果冗余,分類結(jié)果不完備、分類使用不規(guī)范等多方

2、面的問題。為了提升社會標(biāo)注的質(zhì)量,標(biāo)簽推薦作為一種社會標(biāo)注輔助方法成為了相關(guān)領(lǐng)域研究的熱點。
  標(biāo)簽推薦問題已經(jīng)獲得了廣泛而深入的研究??蒲腥藛T提出了大量的標(biāo)簽推薦方法,并在很多實際的數(shù)據(jù)集上取得了良好的效果。然而,當(dāng)前的標(biāo)簽推薦方法在一些關(guān)鍵的問題上仍舊缺乏深入的研究。首先,這些方法要么不關(guān)注標(biāo)簽的語義信息,要么采用基于外部語義源的語義描述方法。受到領(lǐng)域覆蓋,概念定義角度,更新頻率等方面的限制,外部語義源無法很好的適應(yīng)大范圍的

3、社會標(biāo)注應(yīng)用。其次,這些推薦方法比較少關(guān)注對社會標(biāo)注系統(tǒng)數(shù)據(jù)的有效預(yù)處理,無法為推薦算法提供一個有效的數(shù)據(jù)基礎(chǔ)。最后,這些推薦算法在對推薦線索的利用以及用戶個性化建模等方面還存在著不足。這些方面的問題限制了標(biāo)簽推薦的質(zhì)量。
  針對上述問題,為了實現(xiàn)社會標(biāo)注系統(tǒng)中高質(zhì)量的標(biāo)簽推薦,本文進(jìn)行了社會標(biāo)注系統(tǒng)標(biāo)簽推薦方法研究。通過利用少見標(biāo)簽的明確語義及標(biāo)簽間的語義互標(biāo)注,本文構(gòu)建了標(biāo)簽的語義模型,為標(biāo)簽推薦提供了堅實的語義基礎(chǔ);通過識

4、別并區(qū)分分類與主題標(biāo)簽、共識與非共識標(biāo)簽及研究基于關(guān)系的標(biāo)簽擴展,本文實現(xiàn)了社會標(biāo)注數(shù)據(jù)的預(yù)處理,為標(biāo)簽推薦提供了數(shù)據(jù)基礎(chǔ)。在這些工作的基礎(chǔ)之上,本文研究融合多種異構(gòu)對象分析的標(biāo)簽推薦方法,幫助解決社會標(biāo)注系統(tǒng)數(shù)據(jù)稀疏、標(biāo)簽推薦線索不足的問題,并進(jìn)一步研究了用戶自主意識的建模方法,實現(xiàn)更加個性化的標(biāo)簽推薦。具體包括:
  (1)基于語義互標(biāo)注的社會標(biāo)注系統(tǒng)標(biāo)簽語義模型。以社會標(biāo)注系統(tǒng)中具備明確同時具體語義的少見標(biāo)簽所具有的非共識語

5、義信息為基礎(chǔ),利用標(biāo)簽之間的互標(biāo)注現(xiàn)象作為語義的傳播途徑,建模了標(biāo)簽的語義信息,給出了問題的數(shù)學(xué)模型描述及模型的計算方法,并通過實驗對算法的具體性能及參數(shù)的選取對算法的影響進(jìn)行了分析,實現(xiàn)了對標(biāo)簽語義信息的有效建模。
  (2)社會標(biāo)注系統(tǒng)標(biāo)簽數(shù)據(jù)預(yù)處理方法。針對標(biāo)簽主題覆蓋能力不同的現(xiàn)象,研究了基于標(biāo)簽語義層次劃分的分類標(biāo)簽與主題標(biāo)簽識別方法;針對用戶對標(biāo)簽使用所形成的共識情況,研究了共識標(biāo)簽與非共識標(biāo)簽識別方法;針對資源標(biāo)簽分

6、布不均勻,大量資源標(biāo)簽數(shù)量不足的問題,研究了基于對象關(guān)系的資源標(biāo)簽擴展方法。實驗對各個方法的應(yīng)用性能進(jìn)行了基于經(jīng)驗的評估,驗證了方法的可行性,為標(biāo)簽推薦提供了可靠的訓(xùn)練數(shù)據(jù)基礎(chǔ)。
  (3)融合異構(gòu)對象分析的社會標(biāo)注系統(tǒng)標(biāo)簽推薦方法。針對社會標(biāo)注系統(tǒng)中對象間關(guān)系普遍稀疏,無法為標(biāo)簽推薦算法提供充足線索的現(xiàn)實,研究了融合多種對象分析的社會標(biāo)注系統(tǒng)標(biāo)簽推薦方法,通過引入其他類型的,具備稠密關(guān)系的對象補充了標(biāo)簽推薦的線索,給出了具體的概

7、率系統(tǒng)模型描述、參數(shù)估計方法、模型推理方法以及模型的增量更新方法。實驗對模型的性能進(jìn)行了分析,并證明了相比其他方法,該方法可以有效的利用更多推薦線索,實現(xiàn)更高質(zhì)量的標(biāo)簽推薦。
  (4)面向用戶自主意識的社會標(biāo)注系統(tǒng)標(biāo)簽推薦方法。針對當(dāng)前標(biāo)簽推薦方法對用戶對資源及標(biāo)簽的使用偏好建模不足的現(xiàn)狀,研究基于用戶自主意識的標(biāo)簽個性化推薦方法,通過明確的建模用戶對資源的興趣及用戶對不同標(biāo)簽的使用習(xí)慣,實現(xiàn)了高質(zhì)量的個性化標(biāo)簽推薦。實驗表明該

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論