版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的人通過瀏覽互聯(lián)網(wǎng)中產(chǎn)品的評(píng)論信息來了解產(chǎn)品的質(zhì)量與服務(wù)的口碑,以便幫助他們做出可靠的決策;另一方面,作為生產(chǎn)廠家,他們也可以通過用戶的產(chǎn)品評(píng)論及時(shí)了解用戶對(duì)產(chǎn)品的意見或建議,從而在以后的生產(chǎn)中改進(jìn)產(chǎn)品的性能或服務(wù)。由于互聯(lián)網(wǎng)中的產(chǎn)品評(píng)論具有數(shù)量大、隨意性、變化快等特點(diǎn),如果采用傳統(tǒng)人工閱讀的方式,不僅需要消耗很長的時(shí)間,而且即時(shí)性差。這些迫切的應(yīng)用需求使得產(chǎn)品評(píng)論自動(dòng)挖掘應(yīng)勢(shì)而生,并迅速成為信息處理領(lǐng)域的熱點(diǎn)
2、之一。
產(chǎn)品評(píng)論挖掘包括挖掘用戶評(píng)論中提及的產(chǎn)品特征(即評(píng)價(jià)對(duì)象)、挖掘用戶對(duì)產(chǎn)品特征的主要觀點(diǎn)(即評(píng)價(jià)詞)、判斷評(píng)論觀點(diǎn)的情感傾向性以及根據(jù)觀點(diǎn)的重要性進(jìn)行排名等四個(gè)子任務(wù)。
用戶評(píng)論中對(duì)產(chǎn)品特征描述中往往會(huì)利用多個(gè)詞語限定他們描述的是產(chǎn)品具體哪一屬性或哪一個(gè)組件。傳統(tǒng)的產(chǎn)品挖掘抽取出的產(chǎn)品特征僅包含產(chǎn)品屬性或組件名稱,忽略了這些限定關(guān)系。本文利用語義間依賴關(guān)系抽取產(chǎn)品屬性前后的修飾詞組合并作為復(fù)合產(chǎn)品特征
3、。同時(shí)將傳統(tǒng)的評(píng)論挖掘轉(zhuǎn)化為序列標(biāo)注問題,并利用條件隨機(jī)場CRFs在標(biāo)注方面的優(yōu)勢(shì),結(jié)合語義間依賴關(guān)系,提出了基于語義間依賴關(guān)系的條件隨機(jī)場抽取產(chǎn)品復(fù)合特征的算法。在抽取復(fù)合產(chǎn)品特征后,繼續(xù)利用語義間依賴關(guān)系抽取產(chǎn)品特征詞對(duì)應(yīng)的評(píng)價(jià)詞語,最后利用HowNet判斷評(píng)價(jià)詞語的傾向性。通過對(duì)互聯(lián)網(wǎng)中產(chǎn)品評(píng)論進(jìn)行實(shí)驗(yàn),我們?nèi)〉昧溯^高的準(zhǔn)確率與召回率。
本文的主要工作如下:
1、研究了現(xiàn)有的產(chǎn)品評(píng)論挖掘算法,將傳統(tǒng)的評(píng)
4、論挖掘問題轉(zhuǎn)化為序列標(biāo)注的問題。文中以F代表評(píng)價(jià)對(duì)象、O代表評(píng)價(jià)詞,B代表其他無關(guān)詞語來標(biāo)注用戶評(píng)論,從而可以用以F、O、B三元素組成的序列代表評(píng)論。近年來,條件隨機(jī)場CRFs被廣泛應(yīng)用于序列標(biāo)注中,并取得了良好的效果。
2、傳統(tǒng)的產(chǎn)品特征識(shí)別有基于規(guī)則和基于統(tǒng)計(jì)的方法?;谝?guī)則的方法雖具有較高的準(zhǔn)確率,但很大程度上依賴于詞語的先后順序。本文針對(duì)語法依賴關(guān)系采用中心詞語驅(qū)動(dòng),不過多強(qiáng)調(diào)句子中固定詞序的特點(diǎn),將詞語依賴關(guān)系作
5、為條件隨機(jī)場CRFs中的因子,從而將依賴關(guān)系與條件隨機(jī)場CRFs結(jié)合起來對(duì)句子進(jìn)行標(biāo)注。通過對(duì)互聯(lián)網(wǎng)上采集下來的產(chǎn)品評(píng)價(jià)集進(jìn)行挖掘?qū)嶒?yàn),結(jié)果分析表明,算法取得了較高的準(zhǔn)確率和召回率,并具有領(lǐng)域獨(dú)立性的特點(diǎn)。
3、用戶評(píng)論的評(píng)價(jià)對(duì)象與評(píng)價(jià)詞通常成對(duì)出現(xiàn),本文利用中文語義依賴關(guān)系提取產(chǎn)品評(píng)價(jià)對(duì)象所對(duì)應(yīng)的評(píng)價(jià)詞;然后利用基于HowNet等資源的中文極性詞典從而判斷評(píng)價(jià)詞的極性,并進(jìn)一步對(duì)產(chǎn)品特征進(jìn)行極性分類。
4、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)評(píng)論觀點(diǎn)的傾向性分析.pdf
- 網(wǎng)絡(luò)評(píng)論文本的情感傾向性研究.pdf
- 中文產(chǎn)品評(píng)論情感傾向性分類研究.pdf
- 基于復(fù)雜網(wǎng)絡(luò)的在線評(píng)論情感傾向性分類.pdf
- 基于語義搭配的評(píng)論傾向性分析.pdf
- 面向網(wǎng)絡(luò)評(píng)論信息的文本情感傾向性分析.pdf
- 面向產(chǎn)品評(píng)論的跨領(lǐng)域情感傾向性研究.pdf
- 基于卷積神經(jīng)網(wǎng)絡(luò)的在線商品評(píng)論情感傾向性研究.pdf
- 網(wǎng)絡(luò)輿情傾向性分析技術(shù)研究與實(shí)現(xiàn).pdf
- 微博評(píng)論情感傾向性分類研究.pdf
- 基于潛城語義的Web評(píng)論情感傾向性研究.pdf
- 基于特征的商品在線評(píng)論情感傾向性分析.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的文本傾向性分析系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于Web的評(píng)論文本傾向性分析技術(shù)研究.pdf
- 在線評(píng)論語義傾向性分析方法研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的文本傾向性分類研究.pdf
- 基于意見挖掘技術(shù)的網(wǎng)購評(píng)論傾向性分析的研究與應(yīng)用.pdf
- 針對(duì)網(wǎng)絡(luò)輿情的情感傾向性研究.pdf
- 基于Web評(píng)論信息的傾向性分析關(guān)鍵技術(shù)研究.pdf
- 基于HNC理論的網(wǎng)購評(píng)論情感傾向性分析研究.pdf
評(píng)論
0/150
提交評(píng)論