基于概念相似度的科技論文檢索研究.pdf_第1頁
已閱讀1頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著信息化的迅猛發(fā)展,網(wǎng)絡(luò)已成為人們獲取信息的主要來源。但是,人們獲得個人價值偏向的信息(知識)表現(xiàn)為兩種困惑:(1) Web頁面的無結(jié)構(gòu)性、超鏈接的無序性以及信息的海量性導(dǎo)致信息迷航;(2)信息資源缺少統(tǒng)一的語義描述,使得用戶難以查找到與需求相關(guān)的資源。如何在大量信息中找到對于用戶有價值的信息已經(jīng)成為信息檢索領(lǐng)域的一個研究熱點。近年來,本體技術(shù)的發(fā)展為這一問題的解決提供了技術(shù)支持?;诒倔w的信息檢索是基于知識的、語義上的檢索,它彌補(bǔ)了

2、傳統(tǒng)的基于關(guān)鍵字信息檢索技術(shù)的缺陷,從而在查準(zhǔn)率和查全率上有更好的保證。本體是語義網(wǎng)的核心,它作為一種領(lǐng)域知識概念化和模型化的方法,可用來描述計算機(jī)處理數(shù)據(jù)的語義信息。語義網(wǎng)旨在賦予Web上所有資源唯一的標(biāo)識,并在資源之間建立起機(jī)器可處理的各類語義聯(lián)系。為了將無序的Web變成有序的計算機(jī)可理解的知識庫,語義網(wǎng)采用多層次的表示框架,本體位于從文檔描述到知識推理轉(zhuǎn)折的層次,因此本體的構(gòu)建是實現(xiàn)語義網(wǎng)的關(guān)鍵環(huán)節(jié)。本體是用來描述某個領(lǐng)域甚至更廣

3、范圍內(nèi)的概念以及概念之間的聯(lián)系,使得這些概念和聯(lián)系在共享的范圍內(nèi)有著明確唯一的定義,達(dá)成一種共識,這樣人和機(jī)器之間就可以進(jìn)行交流。由于概念是組成信息的最小單位,所以概念的相似度計算研究在信息檢索中顯得相當(dāng)重要,在推薦和過濾、數(shù)據(jù)挖掘等領(lǐng)域也有廣泛的應(yīng)用,是當(dāng)今信息技術(shù)領(lǐng)域研究的關(guān)鍵技術(shù)。而本體在信息檢索和人工智能領(lǐng)域的廣泛應(yīng)用,為概念相似度計算研究提供了新的方法。 本文圍繞基于本體的概念相似度計算進(jìn)行研究。首先,介紹了本體理論和

4、技術(shù),包括本體的形式化定義、建模元語、描述語言、構(gòu)建、分類等,為基于本體的概念相似度計算提供了理論基礎(chǔ)。其次,本文提出了一種基于本體的綜合計算概念相似度的模型,該計算模型綜合考慮了四個因素,即屬性相似度、語義距離、層次深度、調(diào)節(jié)因子對概念相似度的影響。最后,本文利用本體建模工具Protege構(gòu)建了一個科技論文本體,利用Jena對科技論文本體進(jìn)行解析,基于本文提出的計算概念相似度的方法計算科技論文之間的相似度并對構(gòu)建的科技論文本體OWL文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論