基于工作流的分布式數(shù)據(jù)倉庫模型的研究.pdf_第1頁
已閱讀1頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計算機技術的飛速發(fā)展給信息產業(yè)帶來了前所未有的繁榮但隨著計算機技術的不斷推廣和使用的深入,人們對它的要求也越來越高。特別是在信息高度發(fā)展的今天,面對著在時間、空間和結構上存在著巨大差異的相關數(shù)據(jù),人們希望計算機能夠提供快速、準確、具有預見性的信息。企業(yè)通過快速響應用戶的需求來提高自身的競爭力,相繼實施或自主開發(fā)了適合于自身業(yè)務的信息系統(tǒng)。通過使用這些系統(tǒng),企業(yè)或組織內逐漸積累起大量的數(shù)據(jù)。由此,出現(xiàn)了一個新的需求,即對大量已有的數(shù)據(jù)進行

2、分析挖掘以支持業(yè)務和高層決策的應用。隨即,一系列用來實現(xiàn)數(shù)據(jù)的分析與挖掘的理論和技術相繼產生,包括數(shù)據(jù)挖掘技術、數(shù)據(jù)倉庫以及分布式數(shù)據(jù)倉庫等。這些理論和技術都可以被歸結為數(shù)據(jù)倉庫。近年來引起了眾多學者的興趣與參與,已成為學術界跨學科的熱門研究領域之一。
   數(shù)據(jù)倉庫不僅包括對數(shù)據(jù)管理的數(shù)據(jù)庫技術,而且還包括對數(shù)據(jù)進行分析挖掘的各種組件,是一個綜合的概念。而分布式數(shù)據(jù)庫DDB(Distributed Data Base)是一組數(shù)

3、據(jù)集,邏輯上它們屬于同一系統(tǒng),而物理上分散在用計算機網(wǎng)絡連接的多個場地上,并統(tǒng)一由一個分布式數(shù)據(jù)庫管理系統(tǒng)管理。分布式數(shù)據(jù)庫系統(tǒng)可以看成是數(shù)據(jù)庫技術和計算機網(wǎng)絡結合的產物。
   本論文通過對數(shù)據(jù)倉庫和分布式數(shù)據(jù)倉庫體系構架的分析,得出當前存在的缺點:不能進行靈活的定制、易用性差、分布式數(shù)據(jù)倉庫為了保持全局數(shù)據(jù)倉庫和局部數(shù)據(jù)倉庫的數(shù)據(jù)一致性需要購買大量且昂貴的存儲設備來保存兩份相同的數(shù)據(jù)。針對這些缺點,本文所做的主要工作如下:<

4、br>   1)改進了一種基于工作流的分布式數(shù)據(jù)倉庫模型,模型的整體結構基于SOA(Service-Oriented Architecture)面向服務的體系結構、分布式。
   2)引入了工作流技術來實現(xiàn)靈活定制數(shù)據(jù)提取需求、分析挖掘需求及結果可視化的需求,并將這些功能封裝成整體模型中的業(yè)務流程服務。在業(yè)務流程服務模型部分引入了數(shù)據(jù)倉庫業(yè)務流程執(zhí)行語言、業(yè)務流程的可達性驗證算法和優(yōu)化算法。
   3)分布式數(shù)據(jù)倉庫模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論