基于情報(bào)檢索語言互操作技術(shù)的集成詞庫構(gòu)建研究——以教育詞庫為例.pdf_第1頁
已閱讀1頁,還剩75頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、由于目前存在多種標(biāo)題表、敘詞表、分類表和網(wǎng)絡(luò)分類法,同一主題概念在不同網(wǎng)站和系統(tǒng)之中采用不同的主題詞或分類號(hào)表達(dá),網(wǎng)絡(luò)信息檢索變得十分困難。用戶最理想的方式是用一個(gè)提問式可以獲取多個(gè)數(shù)據(jù)庫中的檢索結(jié)果。要實(shí)現(xiàn)這一方法,最主要的就是實(shí)現(xiàn)各種情報(bào)檢索語言之間的互操作。近年來,國內(nèi)外學(xué)者一直在探討檢索語言的互操作問題,提出了多種解決方法,主要包括:自動(dòng)匹配轉(zhuǎn)換;中介詞典;集成詞表;映射;翻譯等,并在此基礎(chǔ)上完成了很多互操作的項(xiàng)目,為用戶的信息

2、檢索帶來了很大的方便。 本文擬通過對檢索語言互操作技術(shù)的研究,借鑒國內(nèi)外實(shí)現(xiàn)不同詞表之間互操作的經(jīng)驗(yàn)和方法,建立一個(gè)以《中國分類主題詞表》為核心的兼容體系,即建立一個(gè)可以不斷擴(kuò)充的集成詞庫。這個(gè)集成詞庫包括:《中圖法》與國內(nèi)外分類法的互操作,《漢表》與專業(yè)敘詞表的互操作以及受控語言與自然語言之間的互操作。擬以教育類為試驗(yàn)對象,選用多部中外敘詞表、分類表構(gòu)建詞庫。數(shù)據(jù)來源包括《中國分類主題詞表》、《中國科學(xué)院圖書館圖書分類法》(簡

3、稱《科圖法》)、《杜威十進(jìn)分類法》(DDC)等分類表的教育大類;《教育主題詞表》、《社會(huì)科學(xué)檢索詞表》等主題詞表及下載、抽取的關(guān)鍵詞和關(guān)鍵詞串。 本文主要研究內(nèi)容包括:不同詞表到《中分表》的互操作,包括各分類法與《中圖法》、各主題詞表與《漢表》以及受控語言與自然語言的互操作三部分。對不同分類法的互操作擬采用同現(xiàn)映射和類目相似度計(jì)算等方法,并針對各種算法的不足提出了新的修改意見;對不同主題詞表之間的互操作,擬采用基于結(jié)構(gòu)的自動(dòng)匹配

4、、基于同義詞表的映射等方法;另外,還研究了自然語言到受控語言的轉(zhuǎn)換,為用戶提供自然語言入口,方便用戶檢索、查找。通過上述映射完成詞庫的構(gòu)建,本丈采用兼容矩陣的結(jié)構(gòu)形式來存儲(chǔ)詞庫,分為兩種形式:字順兼容矩陣和分類兼容矩陣。為了便于瀏覽和使用詞庫數(shù)據(jù),采用單機(jī)模式、XML文檔格式及本體對詞庫兼容數(shù)據(jù)進(jìn)行可視化顯示,進(jìn)而為用戶提供各種服務(wù)。 利用Visua1 Basic語言、Access2000、XMLspy等工具開發(fā)設(shè)計(jì)了教育詞庫的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論