

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)庫是日常生產(chǎn)活動中重要的信息存儲和檢索工具,其設(shè)計一直隨需求的變化而發(fā)展,系統(tǒng)架構(gòu)從單機擴大為分布式集群,存儲介質(zhì)從磁盤轉(zhuǎn)移到內(nèi)存,數(shù)據(jù)組織從行式衍生出列式,而作為數(shù)據(jù)庫重要優(yōu)化手段之一的緩存技術(shù)也無時無刻不在演進。
數(shù)據(jù)庫緩存通常分析并結(jié)合系統(tǒng)特性,儲存歷史結(jié)果避免相似操作的重復執(zhí)行,達到加速查詢的目的。從緩存粒度層面可以將目前的緩存技術(shù)分為三類:Page緩存、Tuple緩存和語義緩存,前兩者符合傳統(tǒng)數(shù)據(jù)庫的需求,語義緩
2、存因抽象度高而適用面更廣,但也因此降低了特定場景的優(yōu)化能力。在低并發(fā)、高數(shù)據(jù)處理量的聯(lián)機分析處理OLAP(On-Line Analytical Processing)場景下,如何針對基于內(nèi)存的分布式列式數(shù)據(jù)庫特點為其設(shè)計緩存,是當前熱門研究課題之一。
本論文以自主研發(fā)的分布式列式數(shù)據(jù)庫 Goldfish為背景,針對其列數(shù)據(jù)組織方式和異步推進的分布式計算模型,提出一套分布式物理執(zhí)行計劃語義緩存技術(shù)DPPSCache(Distri
3、buted Physical Planning Semantic Cache),暫存中間結(jié)果,避免重復計算并降低網(wǎng)絡(luò)數(shù)據(jù)傳輸量,加速OLAP類查詢。本論文闡述了DPPSCache的緩存組織方式、緩存匹配算法、代價模型和緩存淘汰算法、緩存可靠性,工作內(nèi)容如下:
1.DPPSCache緩存分布式物理執(zhí)行計劃中物理算子的執(zhí)行結(jié)果,利用算子的局部語義和全局語義信息構(gòu)建緩存特征樹,并為其建立索引;
2.分析特征點語義匹配和值區(qū)
4、間匹配細節(jié),衍生出特征樹匹配方法,提出了基于特征樹的緩存匹配算法CCTM(Cache Characteristic Tree Matching Algorithm);
3.針對分布式列式數(shù)據(jù)庫緩存特點,提出了基于代價模型的緩存淘汰算法RCBR(Reference and Cost Based Replacement Algorithm);
4.分布式環(huán)境下,內(nèi)存中的緩存對象難免因節(jié)點失效而丟失,因此本文設(shè)計了一套緩存
5、可靠存儲策略,包括多副本、糾刪碼和持久化。
本論文在Goldfish數(shù)據(jù)庫基礎(chǔ)上,設(shè)計并實現(xiàn)了一套基于DPPSCache的分布式緩存管理系統(tǒng),并同開源分布式數(shù)據(jù)庫系統(tǒng)Hive和Spark SQL比較,從測試數(shù)據(jù)來看,配有緩存的 Goldfish不僅提升了原有系統(tǒng)的性能,而且在查詢性能方面明顯高于對比系統(tǒng)。同時,在當前場景下 RCBR淘汰算法要優(yōu)于傳統(tǒng)的最近最少使用算法LRU(Least Recently Used)和最少訪問算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于內(nèi)存的分布式列式數(shù)據(jù)庫查詢優(yōu)化.pdf
- NoSQL數(shù)據(jù)庫分布式緩存系統(tǒng)設(shè)計與實現(xiàn).pdf
- 分布式內(nèi)存數(shù)據(jù)庫的設(shè)計與實現(xiàn).pdf
- 分布式內(nèi)存數(shù)據(jù)庫的研究與實現(xiàn).pdf
- 分布式內(nèi)存數(shù)據(jù)庫系統(tǒng)設(shè)計實現(xiàn)與應(yīng)用.pdf
- 分布式內(nèi)存數(shù)據(jù)庫事務(wù)管理的設(shè)計與實現(xiàn).pdf
- 分布式內(nèi)存數(shù)據(jù)庫中間管理系統(tǒng)的研究與設(shè)計.pdf
- 分布式列式內(nèi)存數(shù)據(jù)庫存儲引擎.pdf
- 分布式內(nèi)存數(shù)據(jù)庫系統(tǒng)的設(shè)計與應(yīng)用.pdf
- 面向OLAP的大規(guī)模分布式內(nèi)存列式數(shù)據(jù)庫查詢引擎.pdf
- 面向分布式內(nèi)存計算的緩存數(shù)據(jù)管理系統(tǒng).pdf
- 分布式內(nèi)存數(shù)據(jù)庫數(shù)據(jù)冗余分配研究與應(yīng)用.pdf
- 面向分布式數(shù)據(jù)庫的瓦片查詢熱點的緩存系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于分布式數(shù)據(jù)庫WEB應(yīng)用系統(tǒng)設(shè)計與實現(xiàn).pdf
- 采用Chord協(xié)議實現(xiàn)分布式內(nèi)存數(shù)據(jù)庫系統(tǒng)的研究.pdf
- 一種分布式實時內(nèi)存數(shù)據(jù)庫的設(shè)計.pdf
- 分布式數(shù)據(jù)庫數(shù)據(jù)同步系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 異構(gòu)分布式數(shù)據(jù)庫數(shù)據(jù)同步系統(tǒng)設(shè)計與實現(xiàn).pdf
- 分布式內(nèi)存數(shù)據(jù)庫數(shù)據(jù)并行快速加載與索引技術(shù).pdf
- VOD系統(tǒng)分布式數(shù)據(jù)庫的實現(xiàn)與管理.pdf
評論
0/150
提交評論