版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、指代消解是自然語言處理的重點和難點之一,在文本摘要、機器翻譯、多語言信息處理和信息提取等諸多應用中都涉及到指代消解問題。核函數(shù)的研究和使用是當前機器學習研究領域的熱門課題。作為一種特殊的核函數(shù),樹核函數(shù)已被應用于自然語言處理的各個領域,并取得了一定的成功。 本文深入分析了現(xiàn)有的指代消解技術并進行了歸類總結。針對結構化信息在指代消解中的重要作用,本文使用SVM提供的卷積樹核函數(shù)自動獲取句法結構信息,并將句法樹作為一個特征,和其它基
2、本特征相結合,從而訓練得到一個分類器對代詞進行消解。 在基于卷積樹核的英文代詞消解研究中,本文首先考察了句法樹的裁剪和擴展,通過適當?shù)牟眉舨呗赃x擇一棵合適的子樹。裁剪策略主要分為靜態(tài)裁剪和動態(tài)裁剪,在ACE2004 NWIRE語料上的實驗表明,在僅使用裁剪策略的情況下,動態(tài)裁剪樹要好于靜態(tài)裁剪樹,動態(tài)裁剪樹的F值達到了79.3%。由于很多句法樹的區(qū)分能力不足,所以本文考慮句法樹的語義擴展,將一些語義節(jié)點掛到句法樹上。實驗表明,句
3、法樹的語義擴展能顯著提高系統(tǒng)的性能。 針對卷積樹核和指代消解的特點,本文分別考慮了訓練實例的過濾和系表it的過濾,從而達到優(yōu)化分類器的性能。訓練實例的過濾主要過濾一些明顯有指代關系的訓練實例,從而減少分類器的噪音;而系表it的過濾主要是過濾那些不需要消解的it。本文還進一步分析了卷積樹核對句法分析器的依賴以及跨句的指代的情況。 此外,針對中文的指代消解,本文單獨實現(xiàn)了一個基于機器學習的指代消解平臺,由于預處理過程并不完善
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于句法特征的代詞消解方法研究.pdf
- 中文代詞消解關鍵技術研究.pdf
- 基于規(guī)則與統(tǒng)計相結合的中文人稱代詞指代消解研究.pdf
- 基于深度學習的中文代詞消解及其在問答系統(tǒng)中的應用.pdf
- 基于樹核方法的中文語義角色標注研究.pdf
- 基于依存樹核函數(shù)的語義角色標注研究.pdf
- 基于樹核函數(shù)的句子級別情感分類研究.pdf
- 基于樹核的無指導中文語義關系抽取研究
- 基于樹核的無指導中文語義關系抽取研究.pdf
- 基于樹核的蛋白質(zhì)相互作用關系提取研究.pdf
- 基于樹核函數(shù)的中文實體語義關系抽取方法的研究.pdf
- 基于樹核函數(shù)的命名實體語義關系抽取方法的研究.pdf
- 基于指代消解的自動文摘研究.pdf
- 家 鄉(xiāng) 的 核 桃 樹
- 基于語義分析樹核的句子相似度計算.pdf
- 樹的核與中心的并行算法研究.pdf
- 基于框架語義標注的指代消解研究.pdf
- 基于樹核函數(shù)的漢語復句關系詞特征分析.pdf
- 基于PSO的協(xié)商僵局消解機制的研究.pdf
- 領域自然語言理解中的代詞消解在機械產(chǎn)品需求分析中的應用.pdf
評論
0/150
提交評論