基于hdfs的云存儲系統(tǒng)的研究與實現(xiàn)_第1頁
已閱讀1頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于HDFS的云存儲系統(tǒng)的研究與實現(xiàn)宋杰[1],邢四為[1],王磊[1],陳林鋒[1](1.安徽大學(xué)計算機科學(xué)與技術(shù)學(xué)院,安徽合肥230601)摘要:針對海量數(shù)據(jù)的存儲問題,傳統(tǒng)方法一般是通過購置更多數(shù)量的服務(wù)器來提升計算和存儲能力,存在硬件成本高,存儲效率低等缺點。本文旨在通過構(gòu)建基于Hadoop分布式文件系統(tǒng)的云存儲系統(tǒng),解決海量數(shù)據(jù)存儲難題。文章首先闡述了云存儲的相關(guān)理論,接著對HDFS的管理機制和MapReduce編程模型進行了

2、分析,最后結(jié)合實際需求,設(shè)計并實現(xiàn)了一個基于Hadoop的云存儲系統(tǒng)。經(jīng)過測試,該系統(tǒng)有效的解決了海量數(shù)據(jù)存儲管理問題,具有開發(fā)成本低、處理速度快、運行穩(wěn)定、易于擴展等特點。關(guān)鍵字:HadoopHDFSMapReduce云存儲分布式系統(tǒng)中圖分類號:TP306文獻標(biāo)志碼:A引言引言隨著計算機網(wǎng)絡(luò)技術(shù)的快速發(fā)展,信息量呈爆炸性增長,數(shù)據(jù)存儲逐漸成為制約企業(yè)發(fā)展的關(guān)鍵問題。企業(yè)現(xiàn)有系統(tǒng)的擴展能力差,難以滿足企業(yè)快速變化的業(yè)務(wù)需求[1]。傳統(tǒng)的

3、NAS方案擴展能力有限,并且面向企業(yè)級的NAS設(shè)備價格往往非常昂貴,購買以及安裝獨立的NAS設(shè)備,將面臨著巨大的經(jīng)濟壓力和額外的維護成本。作為一種新興的商業(yè)計算模型,云計算具有動態(tài)部署的功能,可以利用廉價的服務(wù)器構(gòu)建企業(yè)級存儲平臺,具有更加彈性、更加安全以及更低的成本[2]。本文通過對開源云計算平臺Hadoop的研究,提出了基于Hadoop構(gòu)建云存儲平臺,通過采用Linux集群技術(shù)、分布式文件系統(tǒng)和云計算框架,實現(xiàn)了海量數(shù)據(jù)存儲業(yè)務(wù)1。

4、1.云存儲及其架構(gòu)模式云存儲及其架構(gòu)模式1.1云存儲相關(guān)理論云存儲概念是在云計算概念上延伸和發(fā)展出來的一個新的概念。云存儲的本質(zhì)是服務(wù)[3][4],云存儲通過計算機集群技術(shù)、網(wǎng)格技術(shù)和分布式文件系統(tǒng)等技術(shù),將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備組織起來協(xié)同工作,提供統(tǒng)一的數(shù)據(jù)存儲服務(wù)和業(yè)務(wù)訪問功能的一種存儲模式[5]。云存儲模式比較傳統(tǒng)存儲模式具有如下特點:第一,在功能上,相比傳統(tǒng)存儲模式面向如高性能計算、事務(wù)處理應(yīng)用,云存儲模式具有面向多

5、種類型的網(wǎng)絡(luò)在線存儲服務(wù)的特點;第二,在性能上,云存儲模式具有高數(shù)據(jù)安全性、高可靠性、高效率,以及適合處理大規(guī)模用戶、網(wǎng)絡(luò)環(huán)境復(fù)雜多變等業(yè)務(wù)的特點;第項目基金:2010安徽省自然科學(xué)基金研究項目(KJ2010B123)作者簡介:宋杰(1966),男,副教授,研究方向為嵌入式系統(tǒng)、計算機原理與接口、生物信息學(xué);邢四為(1988),男,碩士生,主要研究方向為嵌入式系統(tǒng)應(yīng)用數(shù)據(jù)集,每個小數(shù)據(jù)集都并行處理,處理后存儲到分布式數(shù)據(jù)庫[10]。Ma

6、pReduce數(shù)據(jù)處理流程如圖2所示。split0split1split2map()map()map()……………reduce()reduce()part0part1InputMappersdleResultReducersOutput圖2MapReduce數(shù)據(jù)處理流程每個MapReduce任務(wù)都被初始化為一個Job,每個Job又可以分為兩個階段:map階段和reduce階段。這兩個階段分別用兩個函數(shù)表示,即map函數(shù)和reduce函數(shù)

7、。map函數(shù)接收一個形式的輸入,然后同樣產(chǎn)生一個形式的中間輸出,Hadoop函數(shù)接收一個如形式的輸入,然后對這個value集合進行處理,每個reduce產(chǎn)生0或1個輸出,reduce的輸出也是形式的[11]。2.云存儲系統(tǒng)的設(shè)計與實現(xiàn)云存儲系統(tǒng)的設(shè)計與實現(xiàn)本文在Hadoop框架的基礎(chǔ)上,運用MapReduce編程模型[12][13][14],設(shè)計并實現(xiàn)了云存儲系統(tǒng)。2.1系統(tǒng)架構(gòu)設(shè)計系統(tǒng)由四部分構(gòu)成,分別為表現(xiàn)層、業(yè)務(wù)邏輯層、數(shù)據(jù)存儲層

8、、基礎(chǔ)設(shè)施層,系統(tǒng)框架如圖3所示。表現(xiàn)層:展現(xiàn)給用戶的Web界面。業(yè)務(wù)邏輯層:負(fù)責(zé)對Hadoop集群中數(shù)據(jù)的操作,對數(shù)據(jù)業(yè)務(wù)的邏輯處理。數(shù)據(jù)存儲層:由數(shù)據(jù)庫、HDFS和MapReduce構(gòu)成,負(fù)責(zé)對數(shù)據(jù)管理與分配任務(wù),為系統(tǒng)提供分布式計算和存儲。基礎(chǔ)設(shè)施層:即硬件基礎(chǔ)設(shè)施,主要包括磁盤、服務(wù)器等。2.2系統(tǒng)功能設(shè)計系統(tǒng)功能設(shè)計包括普通用戶管理、管理員管理和平臺管理三個功能模塊。圖3云存儲系統(tǒng)總體框架圖普通用戶管理:包括創(chuàng)建、查看目錄,上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論