中文文本情感分類研究.pdf_第1頁
已閱讀1頁,還剩57頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著近幾年微博,電子商務(wù)網(wǎng)站興起,用戶及網(wǎng)絡(luò)評(píng)論的數(shù)量呈爆炸性的增長。這些評(píng)論中包含對(duì)產(chǎn)品,熱點(diǎn)事件等的評(píng)判和分析,對(duì)于商家的產(chǎn)品改進(jìn)和政府的輿情監(jiān)控及政策制定有著重要的價(jià)值和意義。其中文本的情感傾向分類就是近幾年興起的一個(gè)研究熱點(diǎn)。
  文本情感傾向分類是一個(gè)二元分類,即判斷文本是含褒義色彩還是貶義色彩。由于情感表達(dá)的復(fù)雜性,究竟哪些詞性的詞語含有更多的情感色彩,對(duì)分類幫助更大,本文對(duì)此將進(jìn)行詳細(xì)的探討。
  對(duì)于跨領(lǐng)域的

2、文本情感分類研究,本文也改進(jìn)了一種情感詞典和特征學(xué)習(xí)結(jié)合的算法,主要的研究成果包括以下幾個(gè)方面:
 ?、傺芯苛瞬煌~性構(gòu)成的停用詞表對(duì)文本情感分類的影響,采用了7種停用詞表,在三個(gè)語料庫上,分別對(duì)無監(jiān)督的基于情感詞典的分類方法和有監(jiān)督的特征學(xué)習(xí)方法進(jìn)行了詳細(xì)的實(shí)驗(yàn)及分析,結(jié)果表明對(duì)于基于情感詞典的分類方法,采用形容詞,動(dòng)詞,副詞除外的詞性的詞語作為停用詞分類結(jié)果較好,傳統(tǒng)的文本主題停用詞對(duì)分類結(jié)果基本無影響,而對(duì)于有監(jiān)督的特征學(xué)習(xí)

3、方法,形容詞,動(dòng)詞,副詞,名詞對(duì)分類結(jié)果的幫助最大,不使用任何停用詞時(shí)取得的分類效果較好。
 ?、诟倪M(jìn)了一種情感詞典和特征學(xué)習(xí)相結(jié)合的跨領(lǐng)域文本情感分類算法,文本情感分類方法主要分為兩種:無監(jiān)督的基于情感知識(shí)的方法和有監(jiān)督的特征學(xué)習(xí)的分類方法。前者不需要已標(biāo)注文本,簡(jiǎn)單易實(shí)現(xiàn),分類精度低;后者分類精度高,但需要大量標(biāo)注數(shù)據(jù),不利于跨領(lǐng)域。Tan等人提出了一種將情感詞典和特征學(xué)習(xí)結(jié)合起來的算法,本文將其算法中使用的臺(tái)灣大學(xué)NTU情感

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論