版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、在輿論自由的背景下,熱點新聞更易成為公眾議論的集中點和矛盾爆發(fā)點,預(yù)測熱點新聞點擊量,有助于政府和傳媒工作者掌握事態(tài)發(fā)展趨勢,提高對熱點事件處理的主動性。同時,挖掘熱點新聞話題演化軌跡能幫助公眾更加快速全面地了解事件的演化軌跡,避免淺嘗輒止和產(chǎn)生偏頗的觀點。
本文以新聞點擊量預(yù)測和新聞演化脈絡(luò)挖掘為研究重點,主要內(nèi)容如下:
(1)提出基于Grey Verhulst模型和極限學(xué)習(xí)機融合的新聞點擊量預(yù)測算法;
2、熱點新聞點擊量數(shù)據(jù)具有隨機性和波動性,不利于后續(xù)準確的預(yù)測。本文提出的算法能夠有效地過濾數(shù)據(jù)的隨機波動噪聲,同時保留數(shù)據(jù)分布規(guī)律,實驗表明所提出的算法在新聞點擊量預(yù)測上的平均準確率較其他算法提升了7%。
(2)提出新聞配圖和新聞文本的多源特征表示算法
新聞的特征表示是挖掘新聞話題演化軌跡的首要步驟,雖然新聞配圖包含大量與事件相關(guān)的信息,但相對新聞文本而言容易被忽略。本文構(gòu)建了一種簡約深度卷積神經(jīng)網(wǎng)絡(luò)模型,用分類概率值
3、表征圖像語義特征,將圖像與文本特征結(jié)合,共同表示新聞。實驗表明多源特征的分類準確率較使用單一文本特征提高了2.4%。
(3)提出基于多標簽分類的新聞演化軌跡挖掘算法
在新聞演化過程中,新聞之間具有相互關(guān)聯(lián)和時間緊鄰的特點,建立t時刻和t+1時刻的新聞相似性度量模型是演化軌跡挖掘的核心。本文提出基于多標簽分類模型的脈絡(luò)挖掘方法,將標簽共現(xiàn)作為新聞相似性度量的依據(jù)。實驗表明獲取的新聞話題演化脈絡(luò)有較好的邏輯性,易于理解。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 熱點新聞點擊量預(yù)測及話題演化算法研究.pdf
- 2021熱點新聞評議
- 網(wǎng)絡(luò)體育熱點新聞研究.pdf
- 網(wǎng)絡(luò)體育熱點新聞研究
- 2021熱點新聞評議
- 2019年熱點新聞評論范文
- 2022熱點新聞短評500字
- 新聞熱點話題發(fā)現(xiàn)及演化分析研究與應(yīng)用.pdf
- 淺議熱點新聞的價值拓展及觀念創(chuàng)新
- 在線熱點新聞推薦系統(tǒng)研究和實現(xiàn).pdf
- 微博熱點事件中話題演化關(guān)系挖掘算法研究.pdf
- 熱點新聞獲取與管理系統(tǒng)——畢業(yè)論文
- 微博熱點話題發(fā)現(xiàn)與話題演化的研究.pdf
- 熱點新聞獲取與管理系統(tǒng)——畢業(yè)論文
- 熱點新聞獲取與管理系統(tǒng)——畢業(yè)論文
- 2018高考作文素材11月熱點新聞素材
- 2018年高考語文作文熱點新聞素材選編
- 基于LDA的新聞話題演化研究.pdf
- 2018年高考語文作文熱點新聞素材選編
- 2019年高考最新熱點新聞素材(10篇)
評論
0/150
提交評論