2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、微博,微博客的簡稱。其憑借短文本、傳播速度快、信息發(fā)布快等特點一直活躍在社會化網(wǎng)絡應用平臺的前端。微博互動性強、用戶數(shù)量大,社會上的流行熱點新聞或突發(fā)事件能夠在非常短的時間內在微博平臺上迅速傳播。用戶也可以通過互聯(lián)網(wǎng)、手機等移動客戶端方便便捷地登錄微博,發(fā)布信息或瀏覽信息。如今,通過微博瀏覽熱點事件已經(jīng)成為人們獲取最新資訊的重要途徑。近年來,伴隨著大量組織機構平臺微博的開通,官方微博已經(jīng)開始進入人們的視野。官方微博一般屬于組織團體帳號,

2、是經(jīng)過官方認證后的微博,即其真實性已通過驗證。官方微博博文比較權威,博文可信度高,標簽現(xiàn)象鮮明,組織功能的宣傳性博文占比大,具有較強的社會效應,摘要其組織團體的時序事件信息可以大大提高閱讀效率。但由于官方微博多人式分工維護的特點,博文中蘊含著大量官微發(fā)展歷程信息,也存在許多非組織功能性的博文,內容呈現(xiàn)雜合。如何過濾官微組織不相關信息,提取出有價值的官方微博事件信息,聚類相關博文并生成事件摘要成為現(xiàn)今研究的一個必要課題。
  本文首

3、先對官方微博的數(shù)據(jù)特征進行分析研究,提出了語料加權、標簽識別的官方微博事件摘要模型。針對官方微博這個新的微博領域,提出了 CWR(Corpus Weighted Ranking)算法提取官方微博的主題詞,根據(jù)官方微博數(shù)據(jù)功能性特征引入了官微相關詞權重提高官微主題詞提取的準確性。同時根據(jù)官方微博博文的標簽鮮明性特點引入了標簽判定樹,將官微博文劃分長短期性分別處理,并對同一標簽下的碎片型官微博文進行相似度計算,聚類發(fā)現(xiàn)官微事件。然后根據(jù)官微

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論