版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著社會(huì)經(jīng)濟(jì)和科學(xué)技術(shù)的不斷進(jìn)步,圖書館通過建設(shè)特色數(shù)據(jù)庫提升服務(wù)質(zhì)量,彰顯本館特色,增強(qiáng)可持續(xù)發(fā)展的能力和社會(huì)競爭力。特色數(shù)據(jù)庫建設(shè)可以為高校、研究所等研究機(jī)構(gòu)提供信息情報(bào)支持,更好的為地區(qū)經(jīng)濟(jì)發(fā)展服務(wù)。
本文針對(duì)我國部分211院校圖書館特色數(shù)據(jù)庫建設(shè)情況進(jìn)行了調(diào)查,由于社會(huì)經(jīng)濟(jì)發(fā)展的需要,當(dāng)前特色數(shù)據(jù)庫建設(shè)發(fā)展迅速,逐步接近國際水平,但仍然存在重復(fù)建設(shè)、標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)質(zhì)量不高、維護(hù)不及時(shí)等問題。這急需通過建立一套可以統(tǒng)一
2、開發(fā)并發(fā)布特色數(shù)據(jù)庫的系統(tǒng)來解決。雖然現(xiàn)在已經(jīng)出現(xiàn)了類似CALIS這樣的綜合性數(shù)據(jù)庫發(fā)布平臺(tái),但是在專業(yè)化、覆蓋面和功能結(jié)構(gòu)上仍然不能適應(yīng)特色數(shù)據(jù)庫發(fā)展的需要。
從CALIS系統(tǒng)的發(fā)展可以看出,特色數(shù)據(jù)庫發(fā)布平臺(tái)是一個(gè)融合了多種技術(shù)的綜合性平臺(tái),具有采集、轉(zhuǎn)換、編目、瀏覽閱讀、跨庫檢索和數(shù)據(jù)統(tǒng)計(jì)分析等功能,是數(shù)字化圖書館功能的延伸。本文選擇特色數(shù)據(jù)庫諸多問題中較為突出的兩個(gè)問題進(jìn)行研究:如何充分利用不同標(biāo)準(zhǔn)的元數(shù)據(jù);如何利用用
3、戶行為日志指導(dǎo)特色數(shù)據(jù)庫建設(shè)。
通過對(duì)這兩個(gè)問題的深入分析,得出解決方案,完成特色數(shù)據(jù)庫發(fā)布平臺(tái)功能模塊的設(shè)計(jì)。本文針對(duì)上述問題,采用XML和聚類分析兩類技術(shù),設(shè)計(jì)了特色數(shù)據(jù)庫發(fā)布平臺(tái)的兩個(gè)主要功能部件的模型,完成了以下工作:
(1)使用XML描述 MARC元數(shù)據(jù),使用RDF描述 DC元數(shù)據(jù);
(2)使用XLST將已描述的MARC元數(shù)據(jù)轉(zhuǎn)換為DC元數(shù)據(jù);
(3)使用DOM樹將包含有DC元數(shù)據(jù)的XM
4、L導(dǎo)入關(guān)系數(shù)據(jù)庫;
(4)設(shè)計(jì)基于K-means算法的用戶訪問日志的聚類分析;
(5)根據(jù)聚類分析結(jié)果給出圖示,為特色數(shù)據(jù)庫建設(shè)提出指導(dǎo)性意見。
在完成上述工作的過程中,本文著重在以下兩點(diǎn)進(jìn)行了創(chuàng)新性研究:
(1)借助 XML的平臺(tái)無關(guān)性、適合作為數(shù)據(jù)傳遞工具的特性,將大量存在的MARC元數(shù)據(jù)轉(zhuǎn)換為更適合網(wǎng)絡(luò)應(yīng)用的DC元數(shù)據(jù)。用以解決由于特色數(shù)據(jù)庫建設(shè)過程中普遍遇到的元數(shù)據(jù)格式不統(tǒng)一造成的著錄工作
5、量大,建庫效率低,元數(shù)據(jù)資源浪費(fèi)嚴(yán)重,標(biāo)準(zhǔn)不統(tǒng)一,不利于特色資源的共享和未來的發(fā)展的問題。
(2)如何從數(shù)量巨大,結(jié)構(gòu)離散的特色數(shù)據(jù)庫用戶訪問日志中提煉出可以了解用戶需求,指導(dǎo)特色數(shù)據(jù)庫選題、建設(shè)的信息尚在探索中。本文借助 K-means算法聚類速度快、易于實(shí)現(xiàn),且適用于文本、圖像特征等多種數(shù)據(jù)的聚類分析的特點(diǎn),提出了解決方案。
本文試圖通過這兩個(gè)主要功能部件的模型設(shè)計(jì),使當(dāng)前圖書館中使用最為廣泛的兩種元數(shù)據(jù)標(biāo)準(zhǔn) M
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)數(shù)據(jù)庫的XML發(fā)布技術(shù)研究.pdf
- 基于XML的WEB數(shù)據(jù)庫信息發(fā)布系統(tǒng)的研究與設(shè)計(jì).pdf
- 基于XML數(shù)據(jù)庫的數(shù)據(jù)挖掘研究.pdf
- 基于XML的關(guān)系數(shù)據(jù)庫發(fā)布系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于XML的高校教學(xué)資源數(shù)據(jù)庫共享平臺(tái).pdf
- 基于XML數(shù)據(jù)庫網(wǎng)關(guān)的研究.pdf
- 基于XML的異構(gòu)數(shù)據(jù)庫查詢研究.pdf
- 基于XML的異構(gòu)數(shù)據(jù)庫集成研究.pdf
- 基于Native XML數(shù)據(jù)庫的視頻教學(xué)資源平臺(tái)構(gòu)建.pdf
- 基于XML的異構(gòu)數(shù)據(jù)庫共享研究.pdf
- 基于XML的異構(gòu)數(shù)據(jù)庫交換研究.pdf
- 基于XML數(shù)據(jù)庫的數(shù)據(jù)查詢優(yōu)化的研究.pdf
- 基于SOA和XML數(shù)據(jù)庫的翻譯管理平臺(tái)的改造.pdf
- 基于XML的異構(gòu)數(shù)據(jù)庫信息共享研究.pdf
- 基于關(guān)系數(shù)據(jù)庫的多層XML數(shù)據(jù)維護(hù)研究.pdf
- 基于移動(dòng)數(shù)據(jù)庫SwiftDB的XML數(shù)據(jù)管理研究.pdf
- 基于Native XML數(shù)據(jù)庫的索引結(jié)構(gòu)的研究.pdf
- 基于XML模式的異構(gòu)數(shù)據(jù)庫集成的研究.pdf
- 基于XML的數(shù)據(jù)庫技術(shù)及其應(yīng)用的研究.pdf
- 基于XML的數(shù)據(jù)庫交換技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論