版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、微博,微博客的簡稱。其憑借短文本、傳播速度快、信息發(fā)布快等特點一直活躍在社會化網(wǎng)絡應用平臺的前端。微博互動性強、用戶數(shù)量大,社會上的流行熱點新聞或突發(fā)事件能夠在非常短的時間內在微博平臺上迅速傳播。用戶也可以通過互聯(lián)網(wǎng)、手機等移動客戶端方便便捷地登錄微博,發(fā)布信息或瀏覽信息。如今,通過微博瀏覽熱點事件已經(jīng)成為人們獲取最新資訊的重要途徑。近年來,伴隨著大量組織機構平臺微博的開通,官方微博已經(jīng)開始進入人們的視野。官方微博一般屬于組織團體帳號,
2、是經(jīng)過官方認證后的微博,即其真實性已通過驗證。官方微博博文比較權威,博文可信度高,標簽現(xiàn)象鮮明,組織功能的宣傳性博文占比大,具有較強的社會效應,摘要其組織團體的時序事件信息可以大大提高閱讀效率。但由于官方微博多人式分工維護的特點,博文中蘊含著大量官微發(fā)展歷程信息,也存在許多非組織功能性的博文,內容呈現(xiàn)雜合。如何過濾官微組織不相關信息,提取出有價值的官方微博事件信息,聚類相關博文并生成事件摘要成為現(xiàn)今研究的一個必要課題。
本文首
3、先對官方微博的數(shù)據(jù)特征進行分析研究,提出了語料加權、標簽識別的官方微博事件摘要模型。針對官方微博這個新的微博領域,提出了 CWR(Corpus Weighted Ranking)算法提取官方微博的主題詞,根據(jù)官方微博數(shù)據(jù)功能性特征引入了官微相關詞權重提高官微主題詞提取的準確性。同時根據(jù)官方微博博文的標簽鮮明性特點引入了標簽判定樹,將官微博文劃分長短期性分別處理,并對同一標簽下的碎片型官微博文進行相似度計算,聚類發(fā)現(xiàn)官微事件。然后根據(jù)官微
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微博事件自動摘要研究.pdf
- 基于專業(yè)個人微博的事件提取研究.pdf
- 基于語義的個人微博事件提取.pdf
- 政府官方微博研究.pdf
- 微博突發(fā)事件檢測及溯源技術研究.pdf
- 面向微博的觀點摘要關鍵技術研究.pdf
- 地理相關微博流自動摘要技術研究.pdf
- 天津日報與其官方微博的聯(lián)動研究——基于8.12事件的考察
- 媒體官方微博對政治腐敗事件的呈現(xiàn).pdf
- 《大河報》官方微博研究.pdf
- 55967.微博事件抽取的關鍵技術研究
- 企業(yè)官方微博中的面子策略研究——以農(nóng)夫山泉官方微博為例.pdf
- 面向中文微博的關鍵詞提取技術研究.pdf
- 綜合節(jié)目官方微博傳播研究——以“爸爸去哪兒”官方微博為例.pdf
- 面向微博的群體情感摘要關鍵技術研究.pdf
- 微博用戶個性化標簽提取技術研究.pdf
- 面向微博新媒體的公共事件及其社會輿論分析技術研究.pdf
- 微博事件的圖文摘要生成方法研究.pdf
- 基于后綴樹算法的地區(qū)微博摘要技術研究.pdf
- 省級衛(wèi)視官方微博營銷研究.pdf
評論
0/150
提交評論