XML數(shù)據(jù)管理中的結(jié)構(gòu)查詢技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩162頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著互聯(lián)網(wǎng)技術(shù)迅猛發(fā)展,XML已逐漸成為數(shù)據(jù)表達(dá)和數(shù)據(jù)交換的標(biāo)準(zhǔn)。越來越多的Web數(shù)據(jù)通過XML文檔形式呈現(xiàn)。如何有效管理這些XML數(shù)據(jù),是當(dāng)前數(shù)據(jù)庫領(lǐng)域一個重要研究課題。XML數(shù)據(jù)具有半結(jié)構(gòu)化特征,其存儲、查詢、更新比傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)更為復(fù)雜。使用傳統(tǒng)數(shù)據(jù)庫技術(shù)解決XML數(shù)據(jù)管理問題,其效果不佳。為此,需要根據(jù)XML數(shù)據(jù)特點(diǎn),研究開發(fā)新的XML數(shù)據(jù)管理技術(shù)。 本文主要研究XML數(shù)據(jù)管理中的結(jié)構(gòu)查詢處理。XML結(jié)構(gòu)查詢是XML所特

2、有的一類查詢,其查詢條件為XML結(jié)構(gòu)約束,以路徑表達(dá)式形式出現(xiàn)。在XML數(shù)據(jù)查詢中,XML結(jié)構(gòu)查詢占有基礎(chǔ)地位,許多已知的XML查詢語言,如XOuery,XPath等,都以XML結(jié)構(gòu)查詢作為其核心部分。因此,高效的XML結(jié)構(gòu)查詢處理在XML數(shù)據(jù)管理中非常重要。本文根據(jù)路徑表達(dá)式的不同,對XML結(jié)構(gòu)查詢實(shí)行分類處理,從而提高其查詢效率。 首先,本文提出了一種多分類XML結(jié)構(gòu)查詢處理框架MCXArch,具體描述了該框架的兩個重要組成

3、部分:查詢執(zhí)行模型MCXEng和查詢優(yōu)化模型MCxopt。在模型MCXEng中,給出了各類查詢執(zhí)行算子。在模型McxOpt中,給出了多類結(jié)構(gòu)查詢優(yōu)化規(guī)則。接著,本文圍繞McXArch框架,分析研究了四個XML結(jié)構(gòu)查詢關(guān)鍵技術(shù)點(diǎn):XML線性路徑匹配;XML分支路徑匹配;XML結(jié)構(gòu)查詢加速和XML包含連接估計(jì)。 在XML線性路徑匹配研究中,本文提出了兩種新匹配算法:整數(shù)差值匹配法和約簡式遍歷匹配法。整數(shù)差值匹配法用于XML簡單線性路

4、徑匹配;而約簡式遍歷匹配法主要用于XML復(fù)雜線性路徑匹配。這兩種匹配算法都通過約簡方式,提高查詢匹配效率。 在XML分支路徑匹配研究中,本文給出了兩種啟發(fā)式匹配算法:Heur-PC和Heur-Unnested。算法Heur-PC用于簡單分支路徑匹配;算法Heur-unnested用于非自嵌套分支路徑匹配。與先前的小枝連接類匹配算法相比,兩種啟發(fā)式算法所需的查詢匹配時間更少。 在XML結(jié)構(gòu)查詢加速研究中,本文提出了一種位圖

5、過濾加速法。利用前/后綴標(biāo)簽位圖,該方法能加速多類查詢匹配算法,如遍歷類匹配算法、連接類匹配算法等。本文給出了過濾加速原理,并研究了位圖過濾加速法與查詢匹配算法的集成。 在XML包含連接估計(jì)研究中,本文給出了一種權(quán)重哈爾小波的估計(jì)方法。在預(yù)處理階段,使用哈爾小波,壓縮統(tǒng)計(jì)數(shù)據(jù),生成小波摘要。在查詢估計(jì)階段,利用小波系數(shù)重構(gòu),獲取XML包含連接估計(jì)值。同時,在估計(jì)方法中,使用概率權(quán)重模型,體現(xiàn)查詢負(fù)載變化。在相同的空間限制下,權(quán)重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論