自然語言處理中相關語義技術的研究.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、自然語言處理是計算機科學領域與人工智能領域中的一個重要研究方向,它主要研究實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。由于自然語言處理要涉及到紛繁復雜的文字以及需要大量的語料庫做研究基礎,所以至今仍存在許多技術難題,如語言行為與計劃、語義分析、詞義的消歧以及句法的模糊性等。
  語言行為與計劃包括人類的語言和語言要表達的意思以及理解者做出的反應,其難點在于如何理解語言要表達的意思,并做出一個合理的反應,這也是句子相似

2、度中亟待解決的難題。目前,已存在的句子相似度計算方法已經(jīng)取得了不錯的效果,但這些方法幾乎都沒有對句子的主成分進行分析,導致句子相似度計算結果不夠準確。
  本文首先對句子進行了分詞以及句法分析處理,在此基礎上對句子的成分進行了詳細的分析,并對不同的成分賦予了不同的權重值。同時在句子相似度的計算過程中還應用了最優(yōu)二叉樹帶權路徑長度計算方法。最后將本文提出的計算句子相似度的方法應用到信息檢索中,提高了信息檢索中的查準率。實驗結果表明,

3、本文所采用的方法與其他方法相比更加合理有效。
  詞語的語義相關度計算是語義分析的一部分,主要是計算不同詞語間在人類思維中可能存在的關聯(lián)程度。詞語語義相關度計算方法有多種,其中以網(wǎng)絡百科全書為基礎的計算方法越來越受到人們的青睞。但這些方法在對百科詞條內(nèi)容進行分析時沒有對內(nèi)容進行全面的考慮,所以可能使結果存在一定的偏差和錯誤。
  以百度百科為數(shù)據(jù)集,將每兩個詞條組成詞條對,分析每個詞條對頁面上的不同內(nèi)容和內(nèi)鏈。計算詞條頁面中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論