基于語義的網(wǎng)上圖書自動問答系統(tǒng)研究.pdf_第1頁
已閱讀1頁,還剩99頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著Intenret的快速發(fā)展,特別是WWW的飛速發(fā)展,網(wǎng)上信息資源越來越豐富,網(wǎng)絡(luò)已經(jīng)成為了一個全球最大的分布式的信息庫,為信息共享、資源共享提供了一個良好的平臺,是人們獲得信息的必要途徑和重要手段。但是由于網(wǎng)上信息浩繁,具有分布分散、重復(fù)性大、動態(tài)變化、結(jié)構(gòu)復(fù)雜、缺乏統(tǒng)一管理等特點,使得用戶根本無法完全了解龐大的、瞬息萬變的信息資源。隨著大量的信息涌入網(wǎng)絡(luò),用戶信息的查找與獲取也就變得越來越困難,出現(xiàn)了“信息迷失”、“信息過載”等問

2、題。搜索引擎是目前人們進行網(wǎng)絡(luò)信息檢索的主要工具,它在給人們帶來很大便利的同時,也日益暴露出許多弊端:關(guān)鍵字匹配的方式檢索準確率不高,返回的相關(guān)文檔過多且重復(fù)性高。在這種情況下,傳統(tǒng)的基于關(guān)鍵字匹配的搜索引擎己經(jīng)不能滿足用戶需求,人們期盼著新的,具有智能處理能力的、結(jié)果表示形式更為簡潔的新一代搜索引擎的出現(xiàn)。在這種需求的推動之下,本文致力于將自動問答處理技術(shù)和Web信息檢索技術(shù)相結(jié)合,以提高現(xiàn)有搜索引擎對信息的智能處理能力,提供更加人性

3、化的人機交互方式,用簡潔、準確的答案,自動地回答用戶用自然語言提出的問題,幫助人們快速而有效地找到所需的信息。 論文在分析了傳統(tǒng)問答系統(tǒng)基本架構(gòu),以及現(xiàn)有處理方法中存在不足的基礎(chǔ)上,展開了面向Web信息的自動問答關(guān)鍵技術(shù)研究,提出了以框架語義為語義基礎(chǔ)、以本體為知識描述的自動問答技術(shù),并給出了其應(yīng)用在圖書信息領(lǐng)域中的原型系統(tǒng).網(wǎng)上圖書問答系統(tǒng)的系統(tǒng)架構(gòu)及關(guān)鍵技術(shù)的實現(xiàn)方案。 論文的主要工作可以概括為以下幾點: (

4、1)研究針對Web環(huán)境海量、異構(gòu)的圖書信息的批量采集、過濾及標準化描述技術(shù),開發(fā)網(wǎng)上圖書信息自動采集系統(tǒng),將分散在多個網(wǎng)站、多個頁面的海量的、異構(gòu)的圖書信息自動采集、過濾及標準化描述,提供統(tǒng)一的操作界面、人性化的菜單和功能鍵,實現(xiàn)不同文件格式的數(shù)據(jù)共享,達到圖書信息獲取、存儲、搜索、瀏覽、閱讀、輸出等實用要求。 (2)研究圖書信息領(lǐng)域問句淺層語義分析技術(shù),包括語義塊的定義及詞表建立,語義塊的判定規(guī)則(搭配)的建立,問句向量的定義

5、、分析及生成等; (3)在傳統(tǒng)信息抽取系統(tǒng)研究的基礎(chǔ)上,研究基于CFN的信息抽取技術(shù),并將其應(yīng)用在圖書簡介中,挖掘圖書簡介中的語義信息。傳統(tǒng)的信息抽取技術(shù)處理的均為格式化或半格式化文本,如html、xml或關(guān)系數(shù)據(jù)庫等。處理自然語言文本的信息抽取技術(shù)研究尚在起步階段。而我們擁有漢語框架語義知識庫這部深厚的語義詞典資源,使得我們基于語義的信息抽取技術(shù)的實現(xiàn)成為可能。 (4)探索領(lǐng)域本體構(gòu)建技術(shù),結(jié)合面向Web的圖書元數(shù)據(jù)描

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論