2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩110頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、網(wǎng)絡信息和信息檢索在人們日常生活中已成為不可或缺的組成部分,語言文字占據(jù)信息形式上的絕大多數(shù),實際上關注的是語言形式所承載的內容信息,本質上都涉及自然語言的語義概念。自然語言成分結構間的語義關系計算問題是自然語言理解的關鍵,其本質在于計算語言結構與語言語義之間的對應關系。如何尋找新的思路及其理論和方法,使得語言的結構和語義盡量能同構對應,尤其是適應動態(tài)地計算語言復合結構的概念意義,具有重要的理論研究意義和廣闊的應用前景。盡管語言表達有句

2、、短語等多種形式,但從概念分析角度看都可歸結到詞匯概念間的組合疊置。這與當前國內外語言學聚焦于詞匯理論相一致。 復合結構是一種由若干個名詞性詞匯直接組合而成,在整體上相當于一個新的名詞性詞匯的語言結構形式。和短語、句等語言結構不同,復合結構的構成缺乏功能標記,這對其語義計算形成很大障礙,實際上成為語義計算的一個瓶頸問題。本文主要解決漢語中動詞名物化進入復合結構時的語義解釋問題。研究的起點是從實例分析出發(fā),剖析以往語法研究中的不足

3、,標引復合結構子成分之間的概念關系,歸納復合結構中概念耦合的內在特點以及多語種表達式在復合結構這一層次上存在自然對齊的潛在可能性。首先,作為數(shù)據(jù)準備工作,研究了動詞名物化復合結構的識別;然后,分別構建了兩種基本動詞名物化復合結構(NV型和VN型)的語義解釋模型;最后,還探討了屬性知識在復合結構語義解釋中的應用。 具體來講,本文的創(chuàng)新性工作有以下幾點: 一、提出了一種基于主題詞表和萬維網(wǎng)的復合結構識別方法。為了有效地解決漢

4、語中名詞和動詞組合時的結構歧義問題,構造了兩個新的分類特征集合:詞匯復合能力和指稱模板特征。特征的獲取使用了兩個獨立的資源:主題詞表和萬維網(wǎng),其好處在于不依賴于復合結構出現(xiàn)的具體上下文,可以用于對文檔中的低頻復合結構進行識別,而這是以往的識別模型所無法解決的問題。機器學習實驗表明,兩個新特征集極大的改善了動詞名物化復合結構識別的性能。 二、歸納了漢語NV型復合結構中涉及的語義關系,構建了一個基于詞匯語法模板的復合結構語義解釋模型

5、。模型定義了新的詞匯模板形式:功能詞例化模板,并將其作為分類特征,對復合結構詞匯間的語義關系進行標注。模型的主要優(yōu)點是其對資源的依賴性很低,以往的方法主要利用詞匯本體和句法語料,而該模型則使用純文本語料來獲取復合結構的分類特征,從而使得模型的適用性和可移植性大大增強。實驗表明,基于功能詞例化模板的模型取得了很好的性能。 三、提出了漢語VN型復合結構的語義關系標注集,并設計了一個機器翻譯驅動的復合結構語義解釋模型?;趶秃辖Y構的多

6、語種自然同構假設,模型首先將漢語復合結構自動翻譯為對齊的英文復合結構,然后將英文復合結構作為附加信息,用于對漢語的復合結構進行解釋。模型的主要優(yōu)點是可以利用跨語種的資源,對多語種的對齊復合結構同時進行語義解釋,從而可以在某種程度解決某些語種中的資源缺乏問題。實驗證實,雙語語義解釋模型的性能要好于單語模型。 四、構建了一個屬性知識庫的獲取框架。詞匯概念可以被描述為屬性和屬性值的集合,屬性知識對于復合結構語義解釋非常重要。屬性獲取分

7、為兩個階段,一個階段是屬性詞的獲取,一個階段是屬性宿主的求取。在屬性詞的獲取中,設計了一個機讀詞典和萬維網(wǎng)的協(xié)同自舉算法。算法充分利用了漢語的義符構詞特點,并結合了機讀詞典和萬維網(wǎng)作為屬性知識的來源,對屬性詞進行獲取。而針對屬性宿主的求取,則將其視為一個選擇約束求解問題,通過評估屬性與可能的概念類之間的選擇關聯(lián)度來確定屬性的宿主。該方法的特點在于其可以動態(tài)、高效地獲取以屬性詞為中心的詞匯知識。 五、利用所獲取的屬性知識,提出了一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論