基于用戶信譽評級的UGC質(zhì)量預(yù)判方法.pdf_第1頁
已閱讀1頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、Web2.0時代的到來改變了原有的信息生產(chǎn)方式,信息來源由經(jīng)專業(yè)編輯審核后的書籍、報紙、電視節(jié)目等,轉(zhuǎn)變?yōu)榭捎扇我鈧€體或群體創(chuàng)作、恣意傳播的內(nèi)容。UGC(User-Generated Content)的激增在豐富網(wǎng)絡(luò)信息資源的同時,其質(zhì)量參差不齊,影響互聯(lián)網(wǎng)絡(luò)的健康發(fā)展。如何對低質(zhì)量UGC進行及時有效地評估與甄別、對高質(zhì)量UGC進行高效地組織和管理,影響著網(wǎng)絡(luò)信息環(huán)境的生存與發(fā)展。
  目前,已有關(guān)于UGC質(zhì)量評價與控制的研究多是

2、從信息內(nèi)容角度出發(fā),忽略了用戶行為因素。本研究從用戶信息行為角度出發(fā),通過對用戶歷史行為與UGC質(zhì)量關(guān)系的挖掘,建立用戶信譽評分機制,進而建立基于用戶信譽評級的UGC質(zhì)量預(yù)判模型,實現(xiàn)對用戶未來產(chǎn)出UGC質(zhì)量的有效預(yù)判。研究共分為六個章節(jié),第一章、第二章主要是對UGC研究背景和相關(guān)理論的闡釋;第三章、第四章主要是對影響UGC質(zhì)量的用戶信息行為因素的分析和基于用戶信譽評級的UGC質(zhì)量預(yù)判模型的構(gòu)建,通過挖掘與分析用戶過往信息活動中所產(chǎn)生的

3、創(chuàng)建行為、轉(zhuǎn)發(fā)行為和評論行為等歷史信息行為,進而為用戶建立起個人信息行為信譽評級模型;第五章、第六章主要是對模型有效性的驗證及對未來研究的展望,通過爬蟲抓取和用戶提交相結(jié)合的方法獲取六位用戶一年間使用微博的行為數(shù)據(jù),并以一自然周為一個評測周期,共測得53個時間點下的用戶信息行為數(shù)據(jù),進而計算出用戶信譽得分。同時為降低評價過程的主觀性,設(shè)計 UGC信息質(zhì)量評估系統(tǒng),輔助評估用戶歷史行為信息質(zhì)量。實驗結(jié)果表明,該模型不同于以往依賴單一文本分

4、析對UGC質(zhì)量評估的方法,其結(jié)合信息學(xué)和行為學(xué)方法,具備較高的預(yù)測準(zhǔn)確度。
  由于對用戶信譽等級的評分尚沒有統(tǒng)一的評判標(biāo)準(zhǔn),致使研究中存在一定程度上的主觀性。同時,根據(jù)用戶過往行為記錄疊加起來的用戶信譽,只能對用戶未來行為向好或向壞的趨勢做出一定的預(yù)判。因此,未來的研究可在建立統(tǒng)一用戶信譽評判標(biāo)準(zhǔn)的基礎(chǔ)上,更深層次地挖掘影響UGC質(zhì)量的用戶信息行為,結(jié)合語義分析方法和情感分析方法,進一步提高UGC質(zhì)量預(yù)判的準(zhǔn)確度。
  本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論