版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、BBS作為一種新興的交互性強的媒體,越來越受到網(wǎng)民的青睞,成為了新聞、觀點和民聲的集散地,是網(wǎng)民獲取信息和發(fā)表評論的重要渠道之一。BBS上的發(fā)帖和回帖都圍繞一個個話題,而這些話題呈現(xiàn)出很強的動態(tài)性,怎樣有效的獲取感興趣的話題以及分析話題在時間和內(nèi)容上的演化對分析BBS上出現(xiàn)的信息具有重要意義。
本文首先提出了一種結(jié)合詞位置和主題詞的話題檢測方法,標(biāo)題向量對話題相似性的貢獻很高。詞的能級譜算法能夠發(fā)現(xiàn)單篇文檔中的關(guān)鍵詞,提高
2、話題檢測的效果。實現(xiàn)了一個在線話題檢測系統(tǒng),自動抽取話題標(biāo)識和話題表示,改善了用戶的閱讀體驗和閱讀效率。實驗結(jié)果表明結(jié)合標(biāo)題中心向量、正文中心向量和主題詞中心向量表現(xiàn)出最好的效果,能夠很好地區(qū)分不同的話題。其次,本文提出了一種在線自適應(yīng)主題模型,即OALDA模型,該模型采用兩個矩陣分別記錄詞在主題上的先驗分布和主題在文檔中的分布,能夠自動發(fā)現(xiàn)文本流中新出現(xiàn)的主題和消亡的主題,并展現(xiàn)這些主題在時間和內(nèi)容上的演化,而且主題的數(shù)量是自適應(yīng)的。
最新文檔
- 基于話題檢測與跟蹤的話題搜索技術(shù)研究.pdf
- 面向新聞報道的話題檢測技術(shù)研究.pdf
- 基于系統(tǒng)相似模型與持續(xù)時間的話題檢測技術(shù)研究.pdf
- 基于語義結(jié)構(gòu)和時序特征的話題檢測與跟蹤技術(shù)研究.pdf
- 面向金融領(lǐng)域BBS的話題發(fā)現(xiàn)和熱度評價.pdf
- 基于上下文的話題和話題關(guān)系的演化研究.pdf
- 基于演化理論的BBS熱點話題發(fā)現(xiàn).pdf
- 中文BBS話題檢測系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 群聊話題檢測技術(shù)研究.pdf
- 基于互聯(lián)網(wǎng)的話題分類及敏感話題發(fā)現(xiàn)技術(shù)研究與實現(xiàn).pdf
- 面向論壇的話題發(fā)現(xiàn)、跟蹤及傳播技術(shù)研究.pdf
- 基于種子文檔和統(tǒng)計模型的話題演化研究.pdf
- 面向微博輿情挖掘的話題發(fā)現(xiàn)技術(shù)研究.pdf
- 面向微博輿情挖掘的話題發(fā)現(xiàn)技術(shù)研究
- 中文微博話題檢測與跟蹤技術(shù)研究.pdf
- 53357.面向社交網(wǎng)絡(luò)的話題傳播關(guān)鍵技術(shù)研究
- 中文新聞話題動態(tài)演化及其關(guān)鍵技術(shù)研究.pdf
- 基于容錯粗糙集的話題檢測與跟蹤方法研究.pdf
- 中文Blog熱門話題檢測與跟蹤技術(shù)研究.pdf
- 英、漢跨語言話題檢測與跟蹤技術(shù)研究.pdf
評論
0/150
提交評論