基于特征向量的中英文語義角色標(biāo)注研究.pdf_第1頁
已閱讀1頁,還剩130頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、對句子進(jìn)行正確的語義分析,一直是從事自然語言理解研究的學(xué)者們追求的主要目標(biāo)。隨著通用領(lǐng)域句法分析等技術(shù)的發(fā)展,近年來語義分析開始觸及更深層次的通用領(lǐng)域,但是通用的深層語義分析仍然很難實現(xiàn)。因此目前人們更關(guān)心“淺層語義分析”,一種簡化了的語義分析形式,只標(biāo)注句子中與謂詞有關(guān)的語義角色,如施事、受事、時間和地點等。語義角色標(biāo)注是淺層語義分析的一種實現(xiàn)方式,已成功應(yīng)用于信息抽取、問答系統(tǒng)和機(jī)器翻譯等任務(wù),是目前自然語言理解領(lǐng)域中的一個熱點和關(guān)

2、鍵研究方向。 盡管語義角色標(biāo)注研究已經(jīng)取得了一定的成績,但仍有一些問題亟待解決,如:語義角色標(biāo)注的性能嚴(yán)重依賴于句法分析的性能,在中文的語義角色標(biāo)注中尤其突出;系統(tǒng)發(fā)展遇到瓶頸,性能難以進(jìn)一步提高等。以往研究表明,提高語義角色標(biāo)注系統(tǒng)性能的主要方法是使用基于特征向量的方法。因此本文的研究仍采用基于特征向量的方法,使用不同的句法分析結(jié)果,提出更豐富和有效的語言學(xué)特征,并對標(biāo)注的各個過程進(jìn)行改進(jìn),提高系統(tǒng)的性能。 本文的研究

3、內(nèi)容主要包括三個方面: 1.研究基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注,重點探索改進(jìn)語義角色標(biāo)注的各個部分,提高系統(tǒng)性能。除了進(jìn)行細(xì)致的特征工程外,還提出新的語法結(jié)構(gòu)搭配特征、基于中心詞的剪枝算法和新的后處理機(jī)制。實驗結(jié)果表明,系統(tǒng)取得的性能是目前已知的基于單棵最佳句法分析樹的SRL的最佳性能。 2.研究基于依存句法分析的語義角色標(biāo)注。在構(gòu)建基于依存關(guān)系的語義角色標(biāo)注系統(tǒng)上,提出和改進(jìn)基于依存關(guān)系的特征與剪枝算法,探索使用依

4、存句法分析進(jìn)行謂詞識別,詳細(xì)比較分析與基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注之間的差異。實驗結(jié)果表明,在標(biāo)準(zhǔn)依存關(guān)系上,系統(tǒng)取得了目前已知的最好性能。 3.研究中文語義角色標(biāo)注。探索使用英文語義角色標(biāo)注的研究方法,對中文進(jìn)行語義角色標(biāo)注。對于基于短語結(jié)構(gòu)句法分析的系統(tǒng),重點探索針對中文語言特點,提出更具中文語言特色的特征,分析基于中心詞的剪枝算法和后處理機(jī)制在中文上的使用效果。對于依存句法分析,重點探索基于依存關(guān)系的中文謂詞識別方法

5、和建立完整的中文語義角色標(biāo)注平臺,為這個方向的研究奠定基礎(chǔ)。實驗結(jié)果表明,基于短語結(jié)構(gòu)句法分析的系統(tǒng)結(jié)果超過了目前已知的最好結(jié)果。 本文的主要貢獻(xiàn)在于對基于特征向量的語義角色標(biāo)注進(jìn)行了系統(tǒng)而深入的研究與探索。在基于短語結(jié)構(gòu)句法分析的系統(tǒng)中,提出了優(yōu)化特征組合和新的具有中英文語言特色的語法特征、基于中心詞的剪枝算法、基于共現(xiàn)概率的去除重復(fù)論元和論元嵌套算法。在基于依存句法分析的系統(tǒng)中,提出和改進(jìn)了基于依存關(guān)系的特征與剪枝算法,探索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論