版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái)隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展,XML 已經(jīng)成為Internet 上數(shù)據(jù)表示、存儲(chǔ)和交換方面的標(biāo)準(zhǔn),而電子商務(wù)的興起與企業(yè)自身業(yè)務(wù)的需求又帶動(dòng)了面向服務(wù)架構(gòu)體系(SOA)的蓬勃發(fā)展,使得SOA 成為當(dāng)前熱門(mén)的討論話題。SOA實(shí)質(zhì)上是組織服務(wù)的一種架構(gòu)模式,它把服務(wù)通過(guò)統(tǒng)一的、中立的、定義良好的接口和契約聯(lián)系起來(lái),獨(dú)立于實(shí)現(xiàn)服務(wù)的硬件平臺(tái)、操作系統(tǒng)和編程語(yǔ)言,使服務(wù)通過(guò)統(tǒng)一通用的方式進(jìn)行交互。而XML 具有的自我描述性與跨平臺(tái)性,使得它非
2、常符合SOA環(huán)境的要求,因此,在SOA 體系中使用XML 文檔作為數(shù)據(jù)的傳輸格式和信息載體是XML 一個(gè)很好的應(yīng)用。
但是,XML 文檔一個(gè)最大缺陷就是它的冗余性,尤其是結(jié)構(gòu)信息大量重復(fù)造成XML 數(shù)據(jù)體積龐大,占用過(guò)多的存儲(chǔ)空間與網(wǎng)絡(luò)帶寬,降低了處理效率,增加了SOA消息的傳輸難度,造成了SOA 數(shù)據(jù)傳輸問(wèn)題。為了解決這個(gè)問(wèn)題,在SOA 體系中可以通過(guò)對(duì)服務(wù)器的配置采用GzIP對(duì)傳輸?shù)南⑦M(jìn)行壓縮,GzIP是通用文本壓縮
3、技術(shù)而不是專門(mén)為XML 設(shè)計(jì)的,而本文考慮了XML 數(shù)據(jù)自身特點(diǎn)和SOA 這個(gè)具體應(yīng)用環(huán)境,重點(diǎn)研究了面向存儲(chǔ)與交換的、適合XML 數(shù)據(jù)的壓縮方法,并在前人研究的基礎(chǔ)上提出自己的改進(jìn)。
本文首先闡述SOA基本概念、實(shí)現(xiàn)途徑及由于XML 冗余造成的SOA 數(shù)據(jù)傳輸問(wèn)題,提出對(duì)XML 數(shù)據(jù)進(jìn)行壓縮是解決問(wèn)題的有效手段。然后介紹XML基本概念、相關(guān)處理技術(shù)及存在的冗余,并介紹通用數(shù)據(jù)壓縮技術(shù)中兩種經(jīng)典算法,分別是哈夫曼編碼和LZ
4、77算法,這些基本的壓縮算法是所有壓縮技術(shù)、壓縮工具的基礎(chǔ)。隨后本文敘述了源壓縮模型Xmill的工作原理,它將結(jié)構(gòu)信息與數(shù)據(jù)內(nèi)容相分離,對(duì)結(jié)構(gòu)信息進(jìn)行字典編碼壓縮,對(duì)數(shù)據(jù)部分按照它們所屬標(biāo)簽分門(mén)別類地放進(jìn)相應(yīng)容器中,用Gzip 壓縮。在Xmill中如果有用戶參與,可以根據(jù)用戶的指令對(duì)數(shù)據(jù)容器選用更適合的壓縮方法進(jìn)行處理,能使壓縮率有所提高。本文是在SOA 應(yīng)用環(huán)境中,SOA中傳輸?shù)臄?shù)據(jù)必須遵循XML Schema 文檔定義的規(guī)范,因此,
5、本文在Xmill的基礎(chǔ)上將輔助結(jié)構(gòu)Schema 運(yùn)用到XML 文檔的數(shù)據(jù)壓縮部分,Schema中包含所有XML 文檔元素類型的定義。當(dāng)把數(shù)據(jù)放進(jìn)容器時(shí)通過(guò)讀取XML Schema 文檔中的數(shù)據(jù)類型值,選用適合的壓縮算法對(duì)數(shù)據(jù)容器進(jìn)行壓縮,而不是一味地只用Gzip,如果某些特殊的數(shù)據(jù)類型與壓縮算法沒(méi)有匹配成功,就依然使用Gzip 壓縮,這樣做的優(yōu)勢(shì)是可以獨(dú)立于用戶參與,減輕用戶負(fù)擔(dān),在一定程度上實(shí)現(xiàn)自動(dòng)化。
本文將改進(jìn)后的模
6、型命名為XS-XMLComp(Based on XML Schema of XML dataCompression Technology),它的一個(gè)創(chuàng)新之處就是“因地制宜”地運(yùn)用了輔助性文檔XML Schema,并且壓縮效果比SOA 使用的Gzip 要好。
本文最后進(jìn)行了仿真實(shí)驗(yàn),將XS-XMLComp 與其他幾種壓縮模型進(jìn)行比較,主要比較了壓縮率、處理速度和效率等性能指標(biāo)。通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的分析評(píng)述了各個(gè)方法的優(yōu)缺點(diǎn),并且
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- XML數(shù)據(jù)壓縮技術(shù)的研究.pdf
- 應(yīng)用XML技術(shù)的RFID集成數(shù)據(jù)壓縮算法研究.pdf
- 面向PLC物聯(lián)網(wǎng)應(yīng)用的XML實(shí)時(shí)數(shù)據(jù)壓縮方法研究.pdf
- 面向可視化的體數(shù)據(jù)壓縮技術(shù)研究.pdf
- 面向數(shù)據(jù)庫(kù)的CT數(shù)據(jù)壓縮、檢索和顯示技術(shù)研究.pdf
- 面向?yàn)?zāi)備的無(wú)損數(shù)據(jù)壓縮關(guān)鍵技術(shù)研究.pdf
- 支持壓縮域查詢的XML數(shù)據(jù)壓縮方法研究.pdf
- SAR圖像數(shù)據(jù)壓縮技術(shù)研究.pdf
- 支持查詢的XML數(shù)據(jù)壓縮方法研究.pdf
- 支持查詢的XML數(shù)據(jù)壓縮算法研究.pdf
- 基于HBase的數(shù)據(jù)壓縮技術(shù)研究.pdf
- 數(shù)據(jù)壓縮技術(shù)的研究.pdf
- 武警系統(tǒng)圖像數(shù)據(jù)壓縮技術(shù)研究.pdf
- 自適應(yīng)無(wú)損數(shù)據(jù)壓縮技術(shù)的研究與應(yīng)用.pdf
- 面向網(wǎng)絡(luò)傳輸數(shù)據(jù)壓縮算法的研究與實(shí)現(xiàn).pdf
- 基于SoC的測(cè)試數(shù)據(jù)壓縮技術(shù)研究.pdf
- GPS數(shù)據(jù)壓縮算法的研究與應(yīng)用.pdf
- 基于XML Schema的XML數(shù)據(jù)流壓縮技術(shù)研究.pdf
- SOC測(cè)試數(shù)據(jù)壓縮與測(cè)試生成技術(shù)研究.pdf
- 應(yīng)用于電磁鋼軌探傷的數(shù)據(jù)壓縮技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論