基于文本模式推理的問(wèn)答系統(tǒng)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩185頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在當(dāng)前的自然語(yǔ)言處理領(lǐng)域,問(wèn)答系統(tǒng)是一個(gè)非常值得研究的“熱門(mén)”課題。它既允許用戶以自然語(yǔ)言提問(wèn),又能夠向用戶返回準(zhǔn)確的答案,而不是一些內(nèi)容相關(guān)的網(wǎng)頁(yè)。所以,與傳統(tǒng)的基于關(guān)鍵字匹配的搜索引擎(例如G00gle)相比,問(wèn)答系統(tǒng)能夠更好地滿足用戶的查詢需求,能夠更準(zhǔn)確地檢索出用戶所需要的答案,具有方便、快捷、高效等特點(diǎn)。 但是目前的問(wèn)答系統(tǒng)準(zhǔn)確率都不高。研究表明,其中一個(gè)很重要的原因,在于目前的問(wèn)答系統(tǒng)很少用到推理技術(shù),大規(guī)模運(yùn)用推理

2、規(guī)則的問(wèn)答系統(tǒng)極其少見(jiàn)。問(wèn)答系統(tǒng)缺乏推理能力,推理系統(tǒng)缺乏自然語(yǔ)言理解能力,這是一個(gè)老問(wèn)題了,正是這個(gè)問(wèn)題,困擾著大型知識(shí)庫(kù)系統(tǒng)的建設(shè),也使得花費(fèi)巨大的人力物力建立起來(lái)的知識(shí)庫(kù)系統(tǒng)難以面向公眾開(kāi)展達(dá)到一定質(zhì)量的知識(shí)服務(wù)。 因此,在前人研究的基礎(chǔ)上,本論文提出了“模式推理”的思想,并提出一種新的問(wèn)答系統(tǒng)模型——“淺層結(jié)構(gòu)模式推理”模型。本模型主要有如下特點(diǎn): ①、對(duì)原始文本很少做、甚至不做人工形式化工作,而是將未經(jīng)處理的、

3、無(wú)結(jié)構(gòu)的原始文本,作為知識(shí)庫(kù)。而傳統(tǒng)做法則是手工建立大規(guī)模知識(shí)庫(kù)。同傳統(tǒng)做法相比,免去了知識(shí)形式化的環(huán)節(jié),大大節(jié)省了人力物力。 ②、引進(jìn)句子之間的邏輯推理機(jī)制,使得問(wèn)答系統(tǒng)可以依據(jù)一定的策略進(jìn)行推理,從而能夠根據(jù)現(xiàn)有的知識(shí),推導(dǎo)出用戶所需要的結(jié)論。也就是說(shuō),系統(tǒng)可以從現(xiàn)有知識(shí)出發(fā),通過(guò)邏輯推理機(jī)制,得到新知識(shí)。而傳統(tǒng)做法,則是簡(jiǎn)單的檢索文本中現(xiàn)成的答案,基本上不具備邏輯推理的能力。同傳統(tǒng)做法相比,這種做法大大提高了系統(tǒng)的智能化。

4、 ③、對(duì)于用戶的查詢,可給出準(zhǔn)確的答案。而一些傳統(tǒng)的做法,則是簡(jiǎn)單地返回相關(guān)網(wǎng)頁(yè)或段落。同這些傳統(tǒng)做法相比,這種做法大大提高了系統(tǒng)的準(zhǔn)確性,更加方便、快捷、高效。 為了實(shí)現(xiàn)上述“淺層結(jié)構(gòu)模式推理”模型,本論文從理論上明確了模式合一的概念,定義了模式推理規(guī)則和基于模式推理的“證明”結(jié)構(gòu),并引入了包含變量的索引結(jié)構(gòu),作為實(shí)現(xiàn)逆向模式推理算法的基礎(chǔ)。在此框架下,本文提出了針對(duì)不同環(huán)節(jié)的一系列算法,取得了如下的具體成果:

5、 ①、提出雙模式合一的“減首去尾”算法?;谶@個(gè)算法,提出了一整套的模式推理機(jī)制,并對(duì)這套推理機(jī)制進(jìn)行了優(yōu)化、改進(jìn),有效解決了文本目標(biāo)模式根據(jù)文本事實(shí)庫(kù)、文本規(guī)則庫(kù)進(jìn)行模式推理的問(wèn)題。 ②、提出多模式合一的“圖檢索”算法。根據(jù)這個(gè)算法,可以一次性的檢索出能夠與文本目標(biāo)模式合一的事實(shí)庫(kù)中的所有事實(shí)、規(guī)則庫(kù)中的所有規(guī)則,從而大大提高了模式推理的效率。根據(jù)這個(gè)算法,同樣可以有效的進(jìn)行雙模式合一計(jì)算并求解目標(biāo)模式中的每個(gè)變量所分別對(duì)

6、應(yīng)的代換量。 ③、將“圖檢索”算法與傳統(tǒng)的模式推理機(jī)制進(jìn)行了整合。 ④、深入分析了模式推理中推理循環(huán)(左遞歸)的成因,并提出“同構(gòu)模式”的概念及相應(yīng)算法。在此基礎(chǔ)之上,提出推理循環(huán)的防止原則以及推理循環(huán)的消除算法,從而有效的解決了推理循環(huán)問(wèn)題。 這樣,在擁有一個(gè)包含事實(shí)、規(guī)則的知識(shí)庫(kù)的前提下,就可以通過(guò)這樣一種索引方式,對(duì)知識(shí)庫(kù)進(jìn)行有效的再組織,從而快速找到所有能與目標(biāo)模式匹配的規(guī)則和事實(shí)。 根據(jù)上述“淺

7、層結(jié)構(gòu)模式推理”模型,本論文將模式推理機(jī)制應(yīng)用于問(wèn)答系統(tǒng)中,具體進(jìn)行了如下的工作: ①、提出“內(nèi)嵌謂詞”的概念,并根據(jù)漢語(yǔ)問(wèn)答系統(tǒng)的特點(diǎn),給出了一系列問(wèn)答系統(tǒng)中常用的內(nèi)嵌謂詞,并且對(duì)于每一個(gè)內(nèi)嵌謂詞,分別指出其用途、算法及實(shí)驗(yàn)結(jié)果。 ②、為了說(shuō)明模式推理在問(wèn)答系統(tǒng)中的作用,本論文將模式推理機(jī)制應(yīng)用于一個(gè)限定領(lǐng)域的漢語(yǔ)問(wèn)答系統(tǒng):ChinaQA。本系統(tǒng)從《上下五千年》這本書(shū)中抽取了若干語(yǔ)句作為知識(shí)庫(kù),回答用戶提出的歷史問(wèn)題。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論