版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)倉庫作為一種分析型的數(shù)據(jù)環(huán)境,越來越受到人們的重視。數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫環(huán)境相分離。相對于操作型環(huán)境而言,分析型環(huán)境對數(shù)據(jù)查詢的速度提出了更高的要求。相對于行存儲,列存儲在讀優(yōu)先的分析型環(huán)境中具有明顯的優(yōu)勢。為此早在一年多之前,作者所在實驗室就開始基于列存儲的數(shù)據(jù)倉庫管理系統(tǒng)的研發(fā)工作。
本文結(jié)合實際項目的研發(fā),研究了數(shù)據(jù)庫和數(shù)據(jù)倉庫的數(shù)據(jù)存儲技術(shù)、現(xiàn)有關(guān)系數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)倉庫管理系統(tǒng)的相關(guān)技術(shù),特別是列存儲技術(shù)
2、,設(shè)計并實現(xiàn)了列存儲數(shù)據(jù)倉庫的存儲結(jié)構(gòu)和管理功能,包括外部存儲和緩存。在緩存管理方面提出了一種基于雙管理鏈的自適應(yīng)頁面置換算法——HA算法(Hybrid Adaptive Algorithm)。
首先,本文研究了傳統(tǒng)RDBMS和行存儲DWMS的數(shù)據(jù)存儲,較詳細(xì)地研究了行存儲和列存儲的DB實現(xiàn)方式,特別分析和總結(jié)了兩種開源數(shù)據(jù)庫PostgreSQL和C-Store的數(shù)據(jù)存儲技術(shù)。
在分析已有關(guān)系數(shù)據(jù)庫存儲的基礎(chǔ)
3、上,對基于列存儲的數(shù)據(jù)倉庫的數(shù)據(jù)存儲進(jìn)行了深入的研究,概要地設(shè)計了DWMS中列存儲的整體結(jié)構(gòu)和功能模塊,詳細(xì)闡述了DWMS中的文件管理器、緩沖區(qū)管理器和訪問方法管理三個部分的設(shè)計與實現(xiàn)。DWMS中的數(shù)據(jù)存儲分為兩個方面:邏輯層次結(jié)構(gòu)和物理層次結(jié)構(gòu)。文件管理器使用分層管理的思想將其分為操作系統(tǒng)文件管理、虛擬文件管理和DWMS文件管理三個部分。虛擬文件管理采用LRU算法淘汰文件句柄、哈希算法查找文件。緩沖區(qū)管理器是整個系統(tǒng)的核心和數(shù)據(jù)流樞紐
4、。
本文在通用的緩沖區(qū)管理算法的基礎(chǔ)上提出了一種基于雙管理鏈的自適應(yīng)頁面置換算法——HA算法,該算法是對DMC(2c)算法的改進(jìn),它引入動態(tài)置換點,同時,根據(jù)缺頁失敗數(shù)確定算法的工作鏈,并根據(jù)頁面訪問序列的局部特征選擇效率較高的頁面置換策略。實驗結(jié)果表明,該算法的缺頁率較改進(jìn)前可降低近30%。B+樹索引是訪問方法管理的一種重要的索引方式。本文主要介紹了該索引的結(jié)構(gòu)、創(chuàng)建、查找和更新操作。
最后,本文分析了DW
5、MS存儲管理器的性能,并提出了它的代價評估模型。結(jié)合該代價評估模型和系統(tǒng)的具體實現(xiàn),從數(shù)據(jù)存儲的角度提出了兩個方面的優(yōu)化:存儲結(jié)構(gòu)的優(yōu)化和數(shù)據(jù)緩沖區(qū)管理的優(yōu)化。具體優(yōu)化的方法有:將數(shù)據(jù)項中的ROWID存儲在數(shù)據(jù)塊的頭部信息中,節(jié)省存儲空間;贓塊的設(shè)置操作包含在塊管理中,避免數(shù)據(jù)丟失;將段內(nèi)包含的區(qū)信息保存在段控制塊中,有利于段內(nèi)數(shù)據(jù)掃描;哈希鏈采用雙向鏈表的結(jié)構(gòu),節(jié)省哈希查找時間和便于更新操作;將數(shù)據(jù)緩沖區(qū)進(jìn)行狀態(tài)設(shè)置,減少批量數(shù)據(jù)導(dǎo)入
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DWMS中列存儲的查詢優(yōu)化研究與實現(xiàn).pdf
- 列存儲DWMS中查詢執(zhí)行的研究與實現(xiàn).pdf
- DWMS列存儲中執(zhí)行引擎的優(yōu)化與實現(xiàn).pdf
- 列存儲DWMS中數(shù)據(jù)字典設(shè)計與實現(xiàn).pdf
- DWMS中列存儲索引技術(shù)的研究與改進(jìn).pdf
- 列存儲DWMS中查詢執(zhí)行優(yōu)化.pdf
- 列存儲DWMS中的索引關(guān)鍵技術(shù)研究.pdf
- DWMS中壓縮技術(shù)的研究與實現(xiàn).pdf
- DWMS中索引選擇策略的研究與實現(xiàn).pdf
- 基于列存儲的數(shù)據(jù)復(fù)用研究與實現(xiàn).pdf
- 列存儲系統(tǒng)中并行查詢處理的研究與實現(xiàn).pdf
- 列存儲數(shù)據(jù)倉庫中壓縮技術(shù)的研究與實現(xiàn).pdf
- 列存儲數(shù)據(jù)倉庫的位圖索引研究與實現(xiàn).pdf
- 壓縮的列存儲數(shù)據(jù)的查詢優(yōu)化研究與實現(xiàn).pdf
- 列存儲數(shù)據(jù)倉庫中的查詢重寫關(guān)鍵技術(shù)的研究與實現(xiàn).pdf
- 基于列存儲的OLAP多查詢優(yōu)化策略研究與實現(xiàn).pdf
- KingbaseES數(shù)據(jù)庫列存儲測試的設(shè)計與實現(xiàn).pdf
- 列存儲數(shù)據(jù)倉庫中的查詢優(yōu)化研究.pdf
- 列存儲內(nèi)存數(shù)據(jù)庫SQL引擎的實現(xiàn).pdf
- 云存儲系統(tǒng)中數(shù)據(jù)訪問和存儲接口的研究與實現(xiàn).pdf
評論
0/150
提交評論