校園輿情分析中的意見挖掘技術研究.pdf_第1頁
已閱讀1頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、作為互聯(lián)網(wǎng)的重要組成部分,校園BBS完善了信息化校園的新型校園形態(tài),成為了師生在日常生活中自由獲取信息和交流意見的平臺。但是隨著意見的擴散和逐步深入,各種觀點發(fā)生交流、碰撞、融合,最初個人的意見可能轉(zhuǎn)化為大多數(shù)人的集體意識,最終形成一定規(guī)模的校園網(wǎng)絡輿情。因此,構建針對校園BBS的輿情分析系統(tǒng),對校園輿情進行深入的意見挖掘是重要并且必要的,本文將從以下兩個方面研究校園輿情分析中的意見挖掘技術:
  在文本傾向性分析方面,本文結合校

2、園BBS中用戶常用的情感表達方式,提出了基于情感表達特征的文本傾向性分析模型。本文從文本預處理模塊、文本特征選擇模塊和基于SVM的情感傾向性分析模塊介紹了文本傾向性分析流程。在文本預處理模塊,本文研究了現(xiàn)有情感詞匯資源,總結并整理了用戶詞典、停用詞詞典、否定詞詞典和情感詞詞典?;谳o助詞典,一方面提高了分詞的準確率,使分詞結果更易于進行情感分析,另一方面也降低了某些高頻詞匯的噪音影響,進一步細化了文本預處理的結果。在文本特征抽取模塊,本

3、文分析了用戶常用的情感表達方式,同時結合了校園BBS帖子具有長度較短并且存在大量變形詞的特點,從Bi-gram和情感短語特征、標點符號特征、表情符號特征深度挖掘了文本所蘊含的情感色彩。
  在意見領袖識別方面,本文提出了基于用戶特征與交互網(wǎng)絡的意見領袖識別算法HITS_ FEATURE,該方法結合用戶的特征權重值,分析用戶交互網(wǎng)絡結構,最終識別校園BBS中的意見領袖。首先,通過引入運籌學中的層次分析法,分析用戶特征中的威望度、活躍

4、度、影響力,定量計算用戶的特征權重值。然后,根據(jù)用戶轉(zhuǎn)發(fā)、評論帖子的行為,構建用戶交互網(wǎng)絡,分析用戶交互中的情感傾向性。最后,基于本文提出的HITS_FEATURE算法,計算用戶的權威值,篩選出校園BBS的意見領袖。
  最后,利用從校園BBS爬取的實驗數(shù)據(jù),本文以校園輿情分析中的意見挖掘技術為研究核心,針對其中文本傾向性分析和意見領袖識別兩個部分,設計并詳細分析了實驗。實驗結果表明,本文提出的基于情感表達特征的文本傾向性分析和基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論