中文微博的話題檢測及微博預警.pdf_第1頁
已閱讀1頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著移動互聯(lián)網(wǎng)技術的發(fā)展,微博已經(jīng)成為一種新興的網(wǎng)絡媒體,信息通過微博可以得到快速傳播及擴散,對微博上的話題傳播、檢測及預警技術的研究也變得至關重要。本文首先研究了微博的用戶關系網(wǎng)絡模型、話題傳播模型及話題傳播特點,而后基于以上研究結果,提出了一種中文微博的話題檢測算法及微博預警算法。
  對中文微博的話題檢測算法,本文優(yōu)化了話題檢測中的預處理、特征選取、文本表示、權重計算等步驟,并提出了一種微博計分方式,認為得分小于預設閾值的微

2、博屬于噪聲數(shù)據(jù),首先對微博集中的噪聲數(shù)據(jù)進行初步篩除,而后基于Single-Pass增量式話題聚類算法進行改進,提出了針對中文微博的話題聚類算法,該聚類算法采用了一種新的距離計算方法及中心向量更新算法,實驗結果表明該算法可以有效地篩除大量話題無關的噪聲微博,并能準確地從微博集中發(fā)現(xiàn)熱點話題,同時將微博歸類到正確的話題簇中。
  對微博的預警算法,本文提出了微博轉(zhuǎn)發(fā)鏈關鍵點預測算法及用戶對微博的轉(zhuǎn)發(fā)行為預測算法,并采用以上兩種預測算

3、法進一步給出了話題微博的預警算法。本文通過預測微博轉(zhuǎn)發(fā)鏈的關鍵點及潛在關鍵點的轉(zhuǎn)發(fā)行為及被轉(zhuǎn)發(fā)量,預估出微博下一時間窗的轉(zhuǎn)發(fā)量,對轉(zhuǎn)發(fā)量超過閾值的微博進行預警,實驗表明,轉(zhuǎn)發(fā)鏈關鍵點預測算法及用戶轉(zhuǎn)發(fā)行為預測算法都具有較高的準確率,而微博預警算法也可以有效地預測出可能發(fā)生大轉(zhuǎn)發(fā)量的微博,從而可以提前對這些微博作出預防措施,有效地控制信息在網(wǎng)絡上的傳播和擴散。
  微博的熱點話題檢測可以幫助用戶快速了解目前的熱點話題、熱門事件,也能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論