數(shù)據(jù)庫(kù)第12章 數(shù)據(jù)庫(kù)技術(shù)新進(jìn)展_第1頁(yè)
已閱讀1頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2024/3/20,蘭彬制作,1,數(shù)據(jù)庫(kù)技術(shù)新進(jìn)展,面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng) 分布式數(shù)據(jù)庫(kù)系統(tǒng) 并行數(shù)據(jù)庫(kù)系統(tǒng) 空間數(shù)據(jù)庫(kù) 多媒體數(shù)據(jù)庫(kù)系統(tǒng),隨著計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷拓展,數(shù)據(jù)庫(kù)的應(yīng)用越來越廣泛,數(shù)據(jù)庫(kù)技術(shù)的研究取得了重大突破。各種學(xué)科技術(shù)與數(shù)據(jù)庫(kù)技術(shù)有機(jī)結(jié)合,使數(shù)據(jù)庫(kù)領(lǐng)域中新內(nèi)容、新應(yīng)用、新技術(shù)層出不窮,形成了各種新型的數(shù)據(jù)庫(kù)系統(tǒng)。,工程數(shù)據(jù)庫(kù) 知識(shí)數(shù)據(jù)庫(kù)系統(tǒng) 科學(xué)數(shù)據(jù)庫(kù)  模糊數(shù)據(jù)庫(kù)系統(tǒng),2024/3/20,蘭彬制

2、作,2,,數(shù)據(jù)庫(kù)技術(shù)新進(jìn)展,2024/3/20,蘭彬制作,3,面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng),面向?qū)ο笏枷雽F(xiàn)實(shí)世界中的任何事物均視為“對(duì)象”,將客觀世界看成是由許多不同種類的對(duì)象構(gòu)成的,不同對(duì)象之間的相互聯(lián)系和相互作用就構(gòu)成了完整的客觀世界。面向?qū)ο蠓椒ㄒ肓藢?duì)象、方法、消息、類、實(shí)例、繼承性、封裝性等一系列重要概念。如今,面向?qū)ο蟮募夹g(shù)逐步擴(kuò)展,逐漸成為程序設(shè)計(jì)、系統(tǒng)設(shè)計(jì)的主要方法。面向?qū)ο笈c數(shù)據(jù)庫(kù)結(jié)合形成了面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)(Object

3、-Oriented Database System,OODBS),它采用面向?qū)ο蟮臄?shù)據(jù)模型,使用面向?qū)ο蟮幕靖拍?,引進(jìn)類、繼承性與封裝性等特性。,OODBS=“面向?qū)ο笙到y(tǒng)+數(shù)據(jù)庫(kù)”,2024/3/20,蘭彬制作,4,面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)滿足的標(biāo)準(zhǔn),① 首先是一個(gè)數(shù)據(jù)庫(kù)系統(tǒng),具有數(shù)據(jù)庫(kù)管理的基本功能,如事務(wù)管理、存儲(chǔ)管理、永久性、交互式查詢、完整性、安全性、并發(fā)處理、故障恢復(fù)等。② 其次是一個(gè)面向?qū)ο蟮南到y(tǒng),充分支持面向?qū)ο蟮母拍詈蜋C(jī)

4、制。支持面向?qū)ο髷?shù)據(jù)模型(Object Oriented數(shù)據(jù)模型,OO數(shù)據(jù)模型),具有運(yùn)用各種構(gòu)造機(jī)制從簡(jiǎn)單對(duì)象組成復(fù)雜對(duì)象的能力,具有對(duì)象標(biāo)識(shí),具有封裝性,具備類和類層次,并且支持繼承性這一強(qiáng)有力的建模工具,具有擴(kuò)充性。,2024/3/20,蘭彬制作,5,面向?qū)ο髷?shù)據(jù)模型,面向?qū)ο髷?shù)據(jù)庫(kù)支持的數(shù)據(jù)模型是面向?qū)ο髷?shù)據(jù)模型(OO數(shù)據(jù)模型)。面向?qū)ο髷?shù)據(jù)模型是用面向?qū)ο蟮挠^點(diǎn)來描述對(duì)象的邏輯組織、關(guān)系等。OO數(shù)據(jù)模型的核心概念是對(duì)象。對(duì)象

5、封裝了屬性和方法。具有相同屬性和方法的所有對(duì)象形成類,對(duì)象是類的實(shí)例。類之間存在繼承、泛化、組成等關(guān)系。面向?qū)ο髷?shù)據(jù)庫(kù)(OODB)使用面向?qū)ο髷?shù)據(jù)庫(kù)語言(OODB語言)。OODB語言用于描述面向?qū)ο髷?shù)據(jù)庫(kù)模式,包括對(duì)象定義語言(ODL)和對(duì)象操作語言(OML)。其中ODL用于定義、生成、修改、刪除類;OML用于生成、存儲(chǔ)、查詢、修改、刪除類的實(shí)例(即對(duì)象)。,2024/3/20,蘭彬制作,6,面向?qū)ο髷?shù)據(jù)庫(kù)的優(yōu)點(diǎn),面向?qū)ο髷?shù)據(jù)庫(kù)很好地

6、克服了傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)的缺點(diǎn)。它既支持面向?qū)ο笠饬x下的對(duì)象的創(chuàng)建和管理,又具有傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)數(shù)據(jù)管理的便利,尤其適合于需要管理復(fù)雜數(shù)據(jù)和計(jì)算繁多的工程類應(yīng)用。 面向?qū)ο髷?shù)據(jù)庫(kù)作為第三代數(shù)據(jù)庫(kù),具有前兩代數(shù)據(jù)庫(kù)無法比擬的優(yōu)點(diǎn),是新型數(shù)據(jù)庫(kù)(如工程數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、演繹數(shù)據(jù)庫(kù))實(shí)現(xiàn)的基礎(chǔ)。,2024/3/20,蘭彬制作,7,面向?qū)ο髷?shù)據(jù)庫(kù)的發(fā)展,以面向?qū)ο蟮某绦蛟O(shè)計(jì)語言為基礎(chǔ),增加數(shù)據(jù)庫(kù)的功能,支持面向?qū)ο竽P?,支持持久?duì)象

7、和實(shí)現(xiàn)數(shù)據(jù)共享。以關(guān)系型數(shù)據(jù)庫(kù)和SQL為基礎(chǔ)擴(kuò)展關(guān)系模型,增加面向?qū)ο蟮奶匦裕衙嫦驅(qū)ο蠹夹g(shù)與關(guān)系數(shù)據(jù)庫(kù)相結(jié)合,建立對(duì)象關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(ORDBMS),這種系統(tǒng)既支持已經(jīng)被廣泛使用的SQL,具有良好的通用性,又具有面向?qū)ο筇匦裕С謴?fù)雜對(duì)象和復(fù)雜對(duì)象的復(fù)雜行為,是面向?qū)ο蠹夹g(shù)和傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)技術(shù)的最佳融合。,不少的數(shù)據(jù)庫(kù)產(chǎn)品都支持對(duì)象模型,這些數(shù)據(jù)庫(kù)的體系結(jié)構(gòu)大體可以分為三類。,2024/3/20,蘭彬制作,8,面向?qū)ο髷?shù)據(jù)庫(kù)的發(fā)

8、展,建立新的面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng),支持面向?qū)ο竽J健@妙悂砻枋鰪?fù)雜對(duì)象,用類中封裝的方法來模擬對(duì)象的復(fù)雜行為,通過繼承性來實(shí)現(xiàn)對(duì)象的結(jié)構(gòu)和方法的重用。,不少的數(shù)據(jù)庫(kù)產(chǎn)品都支持對(duì)象模型,這些數(shù)據(jù)庫(kù)的體系結(jié)構(gòu)大體可以分為三類。,目前,面向?qū)ο髷?shù)據(jù)庫(kù)還缺乏堅(jiān)實(shí)的形式化理論的支持,沒有一個(gè)切實(shí)可行的標(biāo)準(zhǔn),缺乏數(shù)據(jù)庫(kù)的許多功能,以至產(chǎn)品之間的兼容性和可移植性比較差,同時(shí)面向?qū)ο髷?shù)據(jù)庫(kù)也不能與關(guān)系數(shù)據(jù)庫(kù)很好地兼容,所有這些都制約了它的發(fā)展與應(yīng)用,因

9、此需要制定一個(gè)統(tǒng)一的標(biāo)準(zhǔn)并加以約束。,2024/3/20,蘭彬制作,9,分布式數(shù)據(jù)庫(kù)系統(tǒng),隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和應(yīng)用范圍的擴(kuò)充,數(shù)據(jù)庫(kù)系統(tǒng)也需要滿足網(wǎng)絡(luò)應(yīng)用的要求,集中式數(shù)據(jù)庫(kù)系統(tǒng)越來越表現(xiàn)出以下不足。數(shù)據(jù)需要在網(wǎng)絡(luò)上分布存儲(chǔ),采用集中式處理,造成通信開銷大。如果數(shù)據(jù)和應(yīng)用程序集中在一臺(tái)計(jì)算機(jī)上運(yùn)行,一旦該計(jì)算機(jī)發(fā)生故障,則整個(gè)系統(tǒng)受到影響,可靠性不高。集中式處理導(dǎo)致系統(tǒng)的規(guī)模和配置都不夠靈活,系統(tǒng)的可擴(kuò)充性差。,2024

10、/3/20,蘭彬制作,10,分布式數(shù)據(jù)庫(kù)管理系統(tǒng),分布式數(shù)據(jù)庫(kù)是由一組數(shù)據(jù)組成的,這些數(shù)據(jù)分布在計(jì)算機(jī)網(wǎng)絡(luò)的不同結(jié)點(diǎn)(亦稱場(chǎng)地)上,邏輯上是屬于同一系統(tǒng)的。物理上分散而邏輯上集中的數(shù)據(jù)庫(kù)系統(tǒng)稱為分布式數(shù)據(jù)庫(kù)系統(tǒng)(Distributed DataBase System,DDBS)。分布式數(shù)據(jù)庫(kù)的特點(diǎn):分布性。數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)在不同結(jié)點(diǎn)。邏輯完整性。每個(gè)結(jié)點(diǎn)是獨(dú)立的數(shù)據(jù)庫(kù)系統(tǒng),具有獨(dú)立處理能力,可以執(zhí)行局部應(yīng)用,具有高度的自治。同時(shí)

11、結(jié)點(diǎn)之間又相互協(xié)作組成一個(gè)整體,對(duì)于用戶來說,數(shù)據(jù)存儲(chǔ)的分布是透明的,邏輯上如同一個(gè)集中式數(shù)據(jù)庫(kù)系統(tǒng),用戶可以在任何一個(gè)結(jié)點(diǎn)執(zhí)行全局應(yīng)用。分布式數(shù)據(jù)庫(kù)具有數(shù)據(jù)的分布性和邏輯的自治性與完整性,其中邏輯完整性是非常重要的,不支持全局應(yīng)用的數(shù)據(jù)庫(kù)不能稱之為分布式數(shù)據(jù)庫(kù)。,2024/3/20,蘭彬制作,11,分布式數(shù)據(jù)庫(kù)的類型,① 同構(gòu)同質(zhì)型DDBS:各個(gè)場(chǎng)地都采用同一類型的數(shù)據(jù)模型(譬如都是關(guān)系型),并且是同一型號(hào)的DBMS。② 同構(gòu)異質(zhì)

12、型DDBS:各個(gè)場(chǎng)地采用同一類型的數(shù)據(jù)模型,但是DBMS的型號(hào)不同,譬如DB2、Oracle、Sybase、SQL Server等。③ 異構(gòu)型DDBS:各個(gè)場(chǎng)地的數(shù)據(jù)模型的型號(hào)不同,甚至類型也不同。,2024/3/20,蘭彬制作,12,分布式數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn),物理分布性與邏輯整體性。數(shù)據(jù)獨(dú)立性。集中與自治相結(jié)合的控制結(jié)構(gòu)。適當(dāng)增加數(shù)據(jù)冗余度。全局的一致性、可串行性和可恢復(fù)性。,2024/3/20,蘭彬制作,13,分布式數(shù)據(jù)庫(kù)系

13、統(tǒng)的優(yōu)點(diǎn),局部響應(yīng)速度快。系統(tǒng)可靠性高,降低風(fēng)險(xiǎn)。數(shù)據(jù)分散存儲(chǔ)后,通過適當(dāng)?shù)娜哂喽瓤梢蕴峁┹^好的可靠性,避免了因?yàn)槟硞€(gè)結(jié)點(diǎn)的故障而造成全部癱瘓的后果。易于集成現(xiàn)有的系統(tǒng),經(jīng)濟(jì)性能好。具有靈活的體系結(jié)構(gòu),可擴(kuò)展性好。分布式數(shù)據(jù)庫(kù)系統(tǒng)非常容易擴(kuò)展,在分布式數(shù)據(jù)庫(kù)中增加一個(gè)新的結(jié)點(diǎn),不影響現(xiàn)有系統(tǒng)的正常運(yùn)行。,2024/3/20,蘭彬制作,14,并行數(shù)據(jù)庫(kù)系統(tǒng),并行數(shù)據(jù)庫(kù)系統(tǒng)是并行技術(shù)與數(shù)據(jù)庫(kù)技術(shù)結(jié)合的產(chǎn)物,是在并行機(jī)上運(yùn)行的具有并行處

14、理能力的數(shù)據(jù)庫(kù)系統(tǒng),是新一代高性能的數(shù)據(jù)庫(kù)系統(tǒng),具有數(shù)據(jù)庫(kù)操作的時(shí)間并行性和空間并行性。,2024/3/20,蘭彬制作,15,并行數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn),高性能并行數(shù)據(jù)庫(kù)系統(tǒng)將數(shù)據(jù)庫(kù)管理技術(shù)與并行處理技術(shù)有機(jī)結(jié)合,通過不同查詢的并行執(zhí)行、同一查詢內(nèi)的子操作并行執(zhí)行、其他子操作并行執(zhí)行等方式建立并行執(zhí)行計(jì)劃和優(yōu)化查詢,提高了并行數(shù)據(jù)庫(kù)的查詢效率。另外通過在多個(gè)磁盤上分布存儲(chǔ),利用多個(gè)處理機(jī)對(duì)磁盤數(shù)據(jù)進(jìn)行并行處理,從而解決了磁盤“I/O”的瓶頸

15、問題。高可用性與可靠性通過數(shù)據(jù)復(fù)制,提高了并行數(shù)據(jù)庫(kù)系統(tǒng)數(shù)據(jù)庫(kù)的可用性與可靠性。當(dāng)一個(gè)磁盤損壞時(shí),該盤上的數(shù)據(jù)在其他磁盤上的副本仍可供使用,且無需額外的開銷。另外數(shù)據(jù)復(fù)制與數(shù)據(jù)劃分技術(shù)相結(jié)合,可以保證當(dāng)磁盤損壞時(shí)系統(tǒng)仍能并行訪問數(shù)據(jù)??蓴U(kuò)充性通過增加處理和存儲(chǔ)能力,并行數(shù)據(jù)庫(kù)系統(tǒng)具有良好的可擴(kuò)充能力。,2024/3/20,蘭彬制作,16,并行數(shù)據(jù)庫(kù)研究的問題,并行體系結(jié)構(gòu)。為了更好地將并行計(jì)算機(jī)與數(shù)據(jù)庫(kù)結(jié)合,需要研究與并行計(jì)算機(jī)

16、結(jié)構(gòu)相一致的并行數(shù)據(jù)庫(kù)的體系結(jié)構(gòu)及有關(guān)實(shí)現(xiàn)技術(shù)。并行操作算法。為提高并行查詢的效率,需要研究連接、聚合統(tǒng)計(jì)等數(shù)據(jù)操作的并行算法。并行查詢優(yōu)化。對(duì)并型操作的步驟進(jìn)行優(yōu)化組合,以進(jìn)一步提高系統(tǒng)執(zhí)行效率。并行數(shù)據(jù)庫(kù)的物理設(shè)計(jì)。包括數(shù)據(jù)分布算法的研究和數(shù)據(jù)庫(kù)設(shè)計(jì)工具的研究等。并行數(shù)據(jù)庫(kù)的數(shù)據(jù)加載和再組織技術(shù)。,2024/3/20,蘭彬制作,17,并行數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu),共享主存儲(chǔ)器結(jié)構(gòu)(Shared Memory,SM)由多個(gè)處理機(jī)

17、、一個(gè)共享內(nèi)存(主存儲(chǔ)器)和多個(gè)磁盤存儲(chǔ)器構(gòu)成。多處理機(jī)和共享內(nèi)存由高速通信網(wǎng)絡(luò)連接,每個(gè)處理機(jī)可直接存取一個(gè)或多個(gè)磁盤,即所有內(nèi)存與磁盤為所有處理機(jī)共享。SM的優(yōu)點(diǎn)是實(shí)現(xiàn)簡(jiǎn)單、負(fù)載均衡。共享磁盤結(jié)構(gòu)(Shared Disk,SD)多個(gè)有獨(dú)立主存的處理機(jī)通過高速通信網(wǎng)絡(luò)連接磁盤存儲(chǔ)器。每個(gè)處理機(jī)可直接存取任意磁盤存儲(chǔ)器。SD成本低、可擴(kuò)充性好、可用性強(qiáng)、負(fù)載均衡、容易從單處理機(jī)系統(tǒng)遷移。但是實(shí)現(xiàn)起來較復(fù)雜。無共享資源結(jié)構(gòu)(Shar

18、ed Nothing,SN)多個(gè)有獨(dú)立主存和磁盤存儲(chǔ)器的處理機(jī)通過高速通信網(wǎng)絡(luò)互連。集群計(jì)算環(huán)境實(shí)際上是一種典型的SN結(jié)構(gòu)。SN結(jié)構(gòu)成本較低;共享資源最小化減少了由資源競(jìng)爭(zhēng)帶來的系統(tǒng)干擾,任意增加處理機(jī)而不會(huì)增加機(jī)間干擾,可伸縮性好;查詢過程的網(wǎng)絡(luò)通信量最小。但是實(shí)現(xiàn)復(fù)雜、結(jié)點(diǎn)負(fù)荷難以均衡。,2024/3/20,蘭彬制作,18,空間數(shù)據(jù)庫(kù) (1),空間性為了描述現(xiàn)實(shí)世界中的地物和地貌特征,每個(gè)空間對(duì)象都具有空間坐標(biāo),描述了空間物體的

19、位置、形態(tài)、空間拓?fù)潢P(guān)系??臻g性是空間數(shù)據(jù)區(qū)別于其他數(shù)據(jù)的標(biāo)志特征。抽象性空間數(shù)據(jù)描述的是現(xiàn)實(shí)世界中復(fù)雜的地物和地貌特征,必須經(jīng)過抽象處理。不同主題的空間數(shù)據(jù)庫(kù),人們所關(guān)心的內(nèi)容也有差別。多尺度與多態(tài)性不同的觀察尺度具有不同的比例尺和不同的精度,同一地物在不同的情況下就會(huì)有形態(tài)差異。,2024/3/20,蘭彬制作,19,空間數(shù)據(jù)庫(kù)(2),多時(shí)空性空間數(shù)據(jù)具有很強(qiáng)的時(shí)空特性,既有同一時(shí)間不同空間的數(shù)據(jù)系列,也有同一空間不同時(shí)間序

20、列的數(shù)據(jù)。空間數(shù)據(jù)是包括不同時(shí)空和不同尺度數(shù)據(jù)源的集成。非結(jié)構(gòu)化空間對(duì)象沒有固定的數(shù)據(jù)結(jié)構(gòu),屬于非結(jié)構(gòu)化數(shù)據(jù)。多樣性空間數(shù)據(jù)表示的地物不僅具有空間信息,而且具有很多的非空間的附屬信息。如城市的人口,國(guó)民生產(chǎn)總值等,這些構(gòu)成了地理元素的屬性信息。,2024/3/20,蘭彬制作,20,空間數(shù)據(jù)庫(kù)模型(1),混合結(jié)構(gòu)模型(Hybrid Model)用兩個(gè)子系統(tǒng)分別存儲(chǔ)和檢索空間數(shù)據(jù)與屬性數(shù)據(jù),其中屬性數(shù)據(jù)存儲(chǔ)在常規(guī)的RDBMS中,幾

21、何數(shù)據(jù)存儲(chǔ)在空間數(shù)據(jù)管理系統(tǒng)中,兩個(gè)子系統(tǒng)之間使用標(biāo)識(shí)符聯(lián)系。在檢索目標(biāo)時(shí)必須同時(shí)詢問兩個(gè)子系統(tǒng),然后將它們的回答結(jié)合起來。 擴(kuò)展結(jié)構(gòu)模型(Extended Model)采用同一DBMS存儲(chǔ)空間數(shù)據(jù)和屬性數(shù)據(jù)。在標(biāo)準(zhǔn)的關(guān)系數(shù)據(jù)庫(kù)上增加空間數(shù)據(jù)管理層,即利用該層將地理結(jié)構(gòu)查詢語言(GeoSQL)轉(zhuǎn)化成標(biāo)準(zhǔn)的SQL查詢,借助索引數(shù)據(jù)的輔助關(guān)系實(shí)施空間索引操作。這種模型的優(yōu)點(diǎn)是省去了空間數(shù)據(jù)庫(kù)和屬性數(shù)據(jù)庫(kù)之間的繁瑣連接,空間數(shù)據(jù)存取速度較

22、快,但查詢過程復(fù)雜。,2024/3/20,蘭彬制作,21,空間數(shù)據(jù)庫(kù)模型(2),統(tǒng)一模數(shù)據(jù)型(Integrated Model)在開放型DBMS基礎(chǔ)上擴(kuò)充空間數(shù)據(jù)表達(dá)功能。空間擴(kuò)展完全包含在DBMS中,用戶可以使用自己的基本抽象數(shù)據(jù)類型(ADT)來擴(kuò)充DBMS。在核心DBMS中進(jìn)行數(shù)據(jù)類型的直接操作很方便、有效,并且用戶還可以開發(fā)自己的空間存取算法。該模型的缺點(diǎn)是,用戶必須在DBMS環(huán)境中實(shí)施自己的數(shù)據(jù)類型,對(duì)有些應(yīng)用將相當(dāng)復(fù)雜。,2

23、024/3/20,蘭彬制作,22,多媒體數(shù)據(jù)庫(kù)系統(tǒng),多媒體數(shù)據(jù)庫(kù)系統(tǒng)是多媒體技術(shù)與數(shù)據(jù)庫(kù)技術(shù)的結(jié)合,它研究的對(duì)象已從傳統(tǒng)的單一的字符類型的信息媒體發(fā)展為包括圖形、圖像、聲音和字符的多種類型的信息媒體。多媒體數(shù)據(jù)庫(kù)系統(tǒng)需要采用多媒體數(shù)據(jù)模型反映和管理各種媒體數(shù)據(jù)的特性,或各種媒體數(shù)據(jù)之間的空間或時(shí)間的關(guān)聯(lián)。多媒體數(shù)據(jù)庫(kù)允許對(duì)多媒體數(shù)據(jù)存儲(chǔ)、加工、處理,例如能實(shí)現(xiàn)媒體的混合、媒體的擴(kuò)充、媒體的互換等操作。,2024/3/20,蘭彬制作,

24、23,多媒體數(shù)據(jù)庫(kù)系統(tǒng),多媒體數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)提供比傳統(tǒng)數(shù)據(jù)庫(kù)管理系統(tǒng)更強(qiáng)的適合非格式化數(shù)據(jù)查詢的搜索功能,允許對(duì)非格式化數(shù)據(jù)做整體和部分搜索,允許通過范圍、知識(shí)和其他描述符的確定值和模糊值搜索各種媒體數(shù)據(jù),允許同時(shí)搜索多個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù),允許通過對(duì)非格式化數(shù)據(jù)的分析建立圖示等索引來搜`索數(shù)據(jù),允許通過舉例查詢(QuerybyExample)和通過主題描述查詢使復(fù)雜查詢簡(jiǎn)單化。 多媒體數(shù)據(jù)庫(kù)系統(tǒng),目前仍然還是處于研究、發(fā)展階段,目前還

25、沒有成熟的多媒體數(shù)據(jù)庫(kù)管理系統(tǒng)推出。,2024/3/20,蘭彬制作,24,工程數(shù)據(jù)庫(kù),工程數(shù)據(jù)庫(kù)能存儲(chǔ)和管理各種工程設(shè)計(jì)圖形、工程設(shè)計(jì)文檔等工程設(shè)計(jì)制造領(lǐng)域相關(guān)的數(shù)據(jù),能為工程設(shè)計(jì)提供各種服務(wù)的數(shù)據(jù)庫(kù),主要用于CAD/CAM、CIM、CASE等工程應(yīng)用領(lǐng)域。 能描述復(fù)雜的數(shù)據(jù)模型。 支持模式的動(dòng)態(tài)定義和修改,不需重新編譯和數(shù)據(jù)重載。支持工程長(zhǎng)事務(wù)的處理。能存儲(chǔ)和管理各種類型數(shù)據(jù),支持圖形標(biāo)準(zhǔn)件的相互轉(zhuǎn)化,具有多庫(kù)協(xié)調(diào)管理能力。

26、具有版本管理功能。支持程序控制和交互操作兩種工作方式。具有分布式數(shù)據(jù)庫(kù)處理能力,支持多用戶工作環(huán)境。,2024/3/20,蘭彬制作,25,知識(shí)數(shù)據(jù)庫(kù)系統(tǒng),知識(shí)數(shù)據(jù)庫(kù)系統(tǒng)把由大量的事實(shí)、規(guī)則、概念組成的知識(shí)存儲(chǔ)起來,進(jìn)行管理,并為用戶提供方便快速的檢索、查詢手段。知識(shí)數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)具備以下功能。具有多種知識(shí)表示方法。系統(tǒng)化組織管理知識(shí)。知識(shí)庫(kù)的操作,可以進(jìn)行知識(shí)庫(kù)的查詢與檢索。能進(jìn)行知識(shí)的獲取與學(xué)習(xí)。具有便捷的知識(shí)編輯功能。,

27、2024/3/20,蘭彬制作,26,科學(xué)數(shù)據(jù)庫(kù),科學(xué)數(shù)據(jù)庫(kù)是將數(shù)據(jù)庫(kù)應(yīng)用到科學(xué)技術(shù)數(shù)據(jù)處理領(lǐng)域。在科學(xué)數(shù)據(jù)庫(kù)中存放的是專業(yè)科技人員在基礎(chǔ)研究、應(yīng)用研究、科學(xué)實(shí)驗(yàn)及新技術(shù)研究與開發(fā)等各項(xiàng)活動(dòng)中產(chǎn)生并積累的數(shù)據(jù)。,2024/3/20,蘭彬制作,27,模糊數(shù)據(jù)庫(kù)系統(tǒng),把不完全性、不確定性、模糊性引入數(shù)據(jù)庫(kù)系統(tǒng)中,形成模糊數(shù)據(jù)庫(kù)。模糊數(shù)據(jù)庫(kù)能夠存儲(chǔ)模糊數(shù)據(jù),而且數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)聯(lián)系也是模糊的,數(shù)據(jù)上的運(yùn)算和操作、對(duì)數(shù)據(jù)的約束(包括完整性和安全性

28、)、數(shù)據(jù)的一致性、無冗余性的定義等都是模糊的。模糊數(shù)據(jù)庫(kù)的研究方面如何在數(shù)據(jù)庫(kù)中存放模糊數(shù)據(jù)定義各種運(yùn)算,建立模糊數(shù)據(jù)上的函數(shù),2024/3/20,蘭彬制作,28,數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)技術(shù),數(shù) 據(jù) 挖 掘 數(shù) 據(jù) 倉(cāng) 庫(kù) 與 OLAP 數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與實(shí)施 SQL Server 2000 Analysis Services 使用Analysis Services創(chuàng)建數(shù)據(jù)挖掘模型 開 發(fā) OLAP 應(yīng) 用,傳統(tǒng)的數(shù)據(jù)

29、庫(kù)技術(shù)主要用于聯(lián)機(jī)事務(wù)處理(Online Transaction Process,OLTP),數(shù)據(jù)庫(kù)里保存著大量的日常業(yè)務(wù)數(shù)據(jù)和事務(wù)數(shù)據(jù)。由于數(shù)據(jù)量龐大以及數(shù)據(jù)庫(kù)系統(tǒng)中分析方法的嚴(yán)重缺乏,人們很難通過傳統(tǒng)的方法發(fā)現(xiàn)數(shù)據(jù)中隱藏的相互聯(lián)系,更無法根據(jù)當(dāng)前的數(shù)據(jù)去預(yù)測(cè)未來的發(fā)展趨勢(shì)。,2024/3/20,蘭彬制作,29,數(shù)據(jù)挖掘(Data Mining,DM)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知

30、道的、但是潛在有用的信息和知識(shí)的過程。在不同的信息存儲(chǔ)形式上,采用不同的挖掘方法,可以獲得不同類型的知識(shí)。挖掘的數(shù)據(jù)源可以是關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、各種新型數(shù)據(jù)庫(kù)甚至包括Web資源通過采用神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法等不同方法.可以挖掘出關(guān)聯(lián)知識(shí)、預(yù)測(cè)知識(shí)、分類等知識(shí)。,數(shù) 據(jù) 挖 掘,2024/3/20,蘭彬制作,30,數(shù)據(jù)挖掘的主要步驟,,2024/3/20,蘭彬制作,31,數(shù)據(jù)挖掘的主要步驟(1),,1.?dāng)?shù)據(jù)收集 數(shù)據(jù)可

31、以來自于關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、Web上非結(jié)構(gòu)化的文件,不同的數(shù)據(jù)存儲(chǔ),需要不同的數(shù)據(jù)收集方式。2.?dāng)?shù)據(jù)整理 數(shù)據(jù)收集階段得到的數(shù)據(jù)存在一定的“污染”(例如,自身不一致性、存在缺失數(shù)據(jù)),必須對(duì)數(shù)據(jù)進(jìn)行一定的整理。 通過數(shù)據(jù)整理,可以對(duì)數(shù)據(jù)做簡(jiǎn)單的泛化處理,從而在原始數(shù)據(jù)的基礎(chǔ)之上得到更為豐富的數(shù)據(jù)信息,進(jìn)而便于下一步數(shù)據(jù)挖掘的順利進(jìn)行。 ? 數(shù)據(jù)清洗 ? 一致性處理 ? 數(shù)據(jù)泛化

32、 ? 添加缺失數(shù)據(jù),2024/3/20,蘭彬制作,32,數(shù)據(jù)挖掘的主要步驟(2),,3.?dāng)?shù)據(jù)挖掘 根據(jù)任務(wù)要求,選擇合適的挖掘方式,產(chǎn)生感興趣的知識(shí)。不同的知識(shí)類型所選取的挖掘方法也不同。4.?dāng)?shù)據(jù)挖掘結(jié)果的評(píng)估 根據(jù)用戶經(jīng)驗(yàn),也可以直接用實(shí)際數(shù)據(jù)來驗(yàn)證模型的正確性,進(jìn)而調(diào)整挖掘模型,不斷重復(fù)進(jìn)行數(shù)據(jù)挖掘。5.分析決策決策者可以利用數(shù)據(jù)挖掘的結(jié)果,結(jié)合實(shí)際情況,調(diào)整競(jìng)爭(zhēng)策略等。,以上數(shù)據(jù)挖掘經(jīng)過的各個(gè)環(huán)節(jié)并不是單一流程,

33、只有經(jīng)過多次的循環(huán)反復(fù),才可能達(dá)到滿意的結(jié)果。,2024/3/20,蘭彬制作,33,不同存儲(chǔ)形式的數(shù)據(jù)挖掘,1.關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)挖掘。 2.?dāng)?shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)挖掘 3.面向應(yīng)用的新型數(shù)據(jù)源中的數(shù)據(jù)挖掘 4.Web數(shù)據(jù)源中的數(shù)據(jù)挖掘,2024/3/20,蘭彬制作,34,數(shù)據(jù)倉(cāng)庫(kù)與OLAP,數(shù)據(jù)倉(cāng)庫(kù)是一種為信息分析提供良好基礎(chǔ)并支持管理決策活動(dòng)的分析環(huán)境,是面向主題的、集成的、穩(wěn)定的、不可更新的、隨時(shí)間變化的、分層次的多維的集

34、成數(shù)據(jù)集合。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)讓用戶能更快、更方便地查詢所需要的信息,以便進(jìn)行決策支持。 OLAP是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。,2024/3/20,蘭彬制作,35,關(guān)系型數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)中的區(qū)別,2024/3/20,蘭彬制作,36,數(shù)據(jù)倉(cāng)庫(kù)基本術(shù)語(1),主題 主題是一個(gè)較高層次上的數(shù)據(jù)歸類,是將企業(yè)信息系統(tǒng)中的數(shù)據(jù)進(jìn)行綜合、歸類并進(jìn)行分析利用的抽象。它對(duì)應(yīng)企業(yè)某一宏觀分析領(lǐng)域所

35、涉及的分析對(duì)象,每一個(gè)主題都是決策者所關(guān)心的問題。粒度(Granularity)粒度是指數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)單元的詳細(xì)程度和級(jí)別,數(shù)據(jù)越詳細(xì),粒度越小,級(jí)別就越低;數(shù)據(jù)綜合度越高,粒度越大,級(jí)別就越高。,2024/3/20,蘭彬制作,37,數(shù)據(jù)倉(cāng)庫(kù)基本術(shù)語(2),維度(Dimension)維度是指人們觀察事物的角度。例如,關(guān)心產(chǎn)品在不同時(shí)間的銷售變化情況,時(shí)間就是一個(gè)維,如果關(guān)心產(chǎn)品在不同地區(qū)的銷售情況,地區(qū)就是另外一個(gè)維。維是有層次

36、結(jié)構(gòu)的,如描述時(shí)間維可以從日期、周、月份、季度、年等不同層次來描述,這里日期、周、月份、季度、年等就是時(shí)間維的層次。數(shù)據(jù)立方體(Cube)數(shù)據(jù)立方體是指由兩個(gè)或更多維來描述的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)是多維的,通常數(shù)據(jù)立方體也不僅僅包含三維,大多數(shù)會(huì)包含三維以上的維度,這樣的數(shù)據(jù)集稱為數(shù)據(jù)立方體,,2024/3/20,蘭彬制作,38,OLAP的基本功能,旋轉(zhuǎn)(Pivot)鉆?。―rill through)切片和切塊(Slice or Dic

37、e)。,,,,,2024/3/20,蘭彬制作,39,OLAP的存儲(chǔ)結(jié)構(gòu),OLAP在物理上分為3種存儲(chǔ)結(jié)構(gòu) 基于多維數(shù)據(jù)庫(kù)的OLAP存儲(chǔ)結(jié)構(gòu)(MOLAP) 基于關(guān)系數(shù)據(jù)庫(kù)的OLAP存儲(chǔ)結(jié)構(gòu)(ROLAP) 混合型的OLAP存儲(chǔ)結(jié)構(gòu)(HOLAP),2024/3/20,蘭彬制作,40,OLAP的存儲(chǔ)結(jié)構(gòu),MOLAP是指OLAP數(shù)據(jù)存儲(chǔ)在多維數(shù)據(jù)庫(kù)中,使用專用的多維結(jié)構(gòu)存儲(chǔ)分區(qū)的事實(shí)和聚合某個(gè)維度。在MOLAP中,所有的聚合都預(yù)先計(jì)算好,并

38、以文件結(jié)構(gòu)保存。MOLAP模型導(dǎo)致大量數(shù)據(jù)負(fù)載。有很快的查詢反應(yīng)速度??梢岳枚嗑S查詢語言(MDX)方便進(jìn)行多維數(shù)據(jù)集的查詢。ROLAP是使用關(guān)系數(shù)據(jù)庫(kù)中的表存儲(chǔ)多維結(jié)構(gòu)的存儲(chǔ)模式。數(shù)據(jù)保存在RDBMS中,聚合僅在需要時(shí)才計(jì)算出來.這種方法反應(yīng)雖然較慢,但是最靈活。HOLAP是MOLAP和ROLAP的結(jié)合。這種模型中,一部分聚合是預(yù)先計(jì)算的,而另一部分則是從保存在DBMS中的數(shù)據(jù)中計(jì)算出來的。這種模型對(duì)于大多數(shù)常用查詢有最快

39、的反應(yīng)速度,因?yàn)樗鼈兊木酆鲜穷A(yù)先算好的,而它又為切分?jǐn)?shù)據(jù)保存了所有基本數(shù)據(jù)。,2024/3/20,蘭彬制作,41,數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與實(shí)施,數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)需要: 確定主題 確定粒度 建立維度 確定數(shù)據(jù)裝載策略 設(shè)計(jì)數(shù)據(jù)存取工具和不間斷的維護(hù)方案。,2024/3/20,蘭彬制作,42,創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù),建立數(shù)據(jù)庫(kù)和數(shù)據(jù)源 建立維度 建立多維數(shù)據(jù)集 瀏覽多維數(shù)據(jù)集,2024/3/20,蘭彬制作,43,使用Analysis Serv

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論