基于主題情感統(tǒng)一最大熵模型的觀點(diǎn)挖掘研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-05 格式：pdf 頁(yè)數(shù)：57 大?。?.59MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

基于主題情感統(tǒng)一最大熵模型的觀點(diǎn)挖掘研究.pdf_第1頁(yè)

已閱讀1頁(yè)，還剩56頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、電子商務(wù)的大繁榮使得數(shù)以萬計(jì)的用戶開始通過網(wǎng)絡(luò)購(gòu)買各種產(chǎn)品、服務(wù)，并在線發(fā)表評(píng)論信息。許多消費(fèi)者在購(gòu)買某種產(chǎn)品或服務(wù)的時(shí)候，通常會(huì)先參考之前購(gòu)買者的評(píng)論信息，獲得直觀的了解和認(rèn)識(shí)。而商家則通過這些在線評(píng)論信息，獲得用戶對(duì)其產(chǎn)品的反饋信息。但是由于這些評(píng)論信息數(shù)量巨大，僅靠傳統(tǒng)的人工閱讀篩選方式很難快速有效地獲取有價(jià)值的信息。因此，針對(duì)海量在線評(píng)論信息進(jìn)行觀點(diǎn)挖掘成為一個(gè)重要研究課題，得到了國(guó)內(nèi)外研究者的廣泛關(guān)注。
　　觀點(diǎn)挖掘研究

2、主要使用基于規(guī)則的方法、基于語言學(xué)的方法和基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法?；谝?guī)則的方法需要領(lǐng)域?qū)＜叶x不同領(lǐng)域的特征詞和規(guī)則，無法滿足新詞的不斷出現(xiàn)，并且規(guī)則也不具有跨領(lǐng)域性?；谡Z言學(xué)的方法利用語言的語法特性規(guī)律識(shí)別特征詞，但是不同語言的語法組織方式差異非常大，不具有跨語言性。上述兩種方法的可移植性差，而且不能自動(dòng)聚類到具有相似意義的主題下。LDA主題模型作為一種無監(jiān)督統(tǒng)計(jì)主題模型不僅能夠很好地克服上述方法的缺點(diǎn)，還不需要人工標(biāo)記大量訓(xùn)練集

3、，而這正是其他有監(jiān)督和半監(jiān)督統(tǒng)計(jì)模型所必須的，因此得到了研究者的廣泛運(yùn)用。但是由于標(biāo)準(zhǔn)LDA模型是一個(gè)詞袋模型，沒有考慮詞的位置和語義信息，不適合用來提取細(xì)粒度領(lǐng)域特征詞，同時(shí)由于模型是一個(gè)三層結(jié)構(gòu)，也不適合進(jìn)行細(xì)粒度觀點(diǎn)挖掘，因此，需要加以改進(jìn)后才能使用。
　　為解決該問題，本文在對(duì)標(biāo)準(zhǔn)LDA模型進(jìn)行改進(jìn)的基礎(chǔ)上，提出了一個(gè)主題情感統(tǒng)一最大熵LDA模型(Topic and Sentiment Unification Maximu

4、m EntropyModel，TSU MaxEnt-LDA)對(duì)在線網(wǎng)絡(luò)評(píng)論進(jìn)行細(xì)粒度觀點(diǎn)挖掘。首先，在傳統(tǒng)LDA模型中加入最大熵組件，用以區(qū)分背景詞、特征詞和觀點(diǎn)詞;然后，通過加入指示變量，對(duì)特征詞和觀點(diǎn)詞進(jìn)行全局和局部的區(qū)分。最后，在主題層和單詞層之間加入情感層，將傳統(tǒng)的三層LDA模型擴(kuò)展成四層，在提取特征詞和觀點(diǎn)詞的同時(shí)進(jìn)行情感極性分析，先獲取每個(gè)主題的情感極性，再獲取整篇評(píng)論的情感極性，最終生成細(xì)粒度的主題情感摘要圖。
　　

5、為了驗(yàn)證本模型具有跨領(lǐng)域性，實(shí)驗(yàn)選取了常用的兩個(gè)領(lǐng)域的語料庫(kù)，分別是從Citysearch New York提取的Restaurant領(lǐng)域的評(píng)論和從Amazon提取的Electronics領(lǐng)域的評(píng)論。實(shí)驗(yàn)結(jié)果表明本文提出的理論較以往研究有較大的提高，從而證明本模型的正確性。
　　本文內(nèi)容主要分為五章，第一章從各個(gè)方面介紹了本課題的研究背景和研究意義，分析了當(dāng)前國(guó)內(nèi)外研究者在觀點(diǎn)挖掘領(lǐng)域的研究現(xiàn)狀。第二章詳細(xì)介紹了細(xì)粒度觀點(diǎn)挖掘的幾

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于主題情感統(tǒng)一最大熵模型的觀點(diǎn)挖掘研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載