基于語義Web技術的非結構化文檔管理方法研究.pdf_第1頁
已閱讀1頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、目前,伴隨著數(shù)據(jù)庫技術、數(shù)據(jù)挖掘技術、數(shù)據(jù)倉庫技術等的成熟和廣泛應用,結構化文檔管理問題已經(jīng)基本得到解決;信息技術的廣泛應用帶來非結構化文檔激增,但對其應用效率低下,而新興管理思想的涌現(xiàn)以及全球化競爭的日益加劇迫切要求對組織中的非結構化文檔資源進行有效的管理。非結構化文檔管理正日益成為互聯(lián)網(wǎng)時代信息資源管理的一個關鍵問題。
  本文將語義Web技術及標準引入非結構化文檔的分析、標記和應用過程,以形成一套有效的非結構化文檔管理方法,

2、滿足企業(yè)應用的迫切需求。本文首先系統(tǒng)介紹了語義Web的相關理論,其中重點是語義Web的三大關鍵技術:XML、RDF及本體。之后圍繞非結構化文檔管理生命周期的全過程:獲取、標記、組織/存儲及應用,分析了每個環(huán)節(jié)目前還存在的問題。之后引入語義Web技術進行分析和解決,重點解決了:1)文檔標記中涉及到的標記語言(外表特征和內(nèi)容特征兩方面)、標記過程及標記工具,并最終形成完整的結構化的標記描述,以利于計算機進行理解和自動處理;2)組織方法采用基

3、于本體的組織方法代替?zhèn)鹘y(tǒng)線性組織方法,以滿足分布式的網(wǎng)絡信息組織的需要,同時存儲方式采取監(jiān)督機制來協(xié)同源文檔和標記文檔之間的同步關系,以確保兩者同時更改和刪除;3)最后具體的應用則從信息檢索、自動分類、智能推理三個方向來分析:信息檢索時利用本體進行查詢擴展,并根據(jù)語義相似度進行檢索排序;自動分類則以領域本體作為分類樹,以形成動態(tài)統(tǒng)一的分類標準;智能推理方面則利用本體和描述邏輯來實現(xiàn)計算機理解的、規(guī)范化的描述,并利用描述邏輯的推理功能進行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論