版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著云計(jì)算環(huán)境中數(shù)據(jù)量的激增,人們急需研究在云環(huán)境下如何對(duì)大量數(shù)據(jù)進(jìn)行快速有效的分析與處理。在云環(huán)境下對(duì)大量數(shù)據(jù)進(jìn)行高效地排序是其中一個(gè)重要問(wèn)題。一些被廣泛使用的排序算法是否能在云計(jì)算系統(tǒng)中高性能運(yùn)行,運(yùn)行時(shí)所需要消耗的云計(jì)算資源量都是令人非常關(guān)注的問(wèn)題。本文主要進(jìn)行Hadoop平臺(tái)上快速,高效,集群負(fù)載均衡度高,資源消耗少的排序算法的研究,主要工作為:
1)分析研究串行系統(tǒng)中效率較高的排序算法。在熟練掌握MapReduce編
2、程框架和Hadoop體系結(jié)構(gòu)的基礎(chǔ)上,對(duì)Radixsort,Quicksort以及Samplesort在Hadoop平臺(tái)上進(jìn)行實(shí)現(xiàn)。分別對(duì)Radixsort,Quicksort和Samplesort的算法思想及在串行和并行系統(tǒng)中的復(fù)雜度問(wèn)題進(jìn)行比較分析。
2)對(duì)基于Hadoop平臺(tái)的Radixsort,Quicksort和Samplesort的執(zhí)行效率、CPU資源的消耗,內(nèi)存的消耗,以及處理機(jī)間的通信量進(jìn)行研究和比較分析。通過(guò)
3、大量運(yùn)行在Hadoop上的實(shí)驗(yàn),發(fā)現(xiàn)Hadoop平臺(tái)上的Samplesort相較于Radixsort和Quicksort具有排序速度快,負(fù)載均衡度高,CPU消耗低等優(yōu)勢(shì)。這一結(jié)果為云計(jì)算環(huán)境下設(shè)計(jì)更高效、節(jié)能的算法提供了有效的依據(jù)和基礎(chǔ)。
3)針對(duì)不均勻數(shù)據(jù)集的高效排序問(wèn)題,研究并提出了一種排序效率高,負(fù)載均衡度高的隨機(jī)化分區(qū)Samplesort算法。Samplesort是一種在云計(jì)算環(huán)境中大量使用的排序算法。在數(shù)據(jù)可以均勻分
4、割的情況下,samplesort算法把數(shù)據(jù)分割成為多個(gè)數(shù)據(jù)塊,高速并行地對(duì)數(shù)據(jù)塊進(jìn)行排序。Samplesort在處理一些密度均勻的數(shù)據(jù)集時(shí)具有較高效率,而現(xiàn)實(shí)生活中的數(shù)據(jù)集往往分布極不均勻。為了解決密度分布不均勻數(shù)據(jù)集的排序問(wèn)題,提出了一種隨機(jī)化分區(qū)的樣本排序算法,RandomizedPartitionSampleSort(RPSS)。它引入了一個(gè)隨機(jī)化分區(qū)函數(shù),能夠使得密度不均勻數(shù)據(jù)相對(duì)均勻的分布。通過(guò)大量運(yùn)行在Hadoop集群上的實(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于云環(huán)境下排序的模糊關(guān)鍵字搜索.pdf
- 云計(jì)算環(huán)境下關(guān)聯(lián)規(guī)則算法的研究.pdf
- 云計(jì)算環(huán)境下任務(wù)調(diào)度算法的研究.pdf
- 云計(jì)算環(huán)境中任務(wù)調(diào)度算法研究.pdf
- 云計(jì)算環(huán)境下的計(jì)算模型性能優(yōu)化研究.pdf
- 多排序者下排序集抽樣的均值估計(jì).pdf
- 云計(jì)算環(huán)境下的并行SVM算法研究.pdf
- 云計(jì)算環(huán)境下的資源調(diào)度算法研究.pdf
- 云計(jì)算環(huán)境下資源分配算法的研究.pdf
- 云計(jì)算環(huán)境下的模式挖掘算法研究.pdf
- 云計(jì)算環(huán)境下任務(wù)調(diào)度算法研究.pdf
- 基于云計(jì)算環(huán)境的web數(shù)據(jù)挖掘算法研究.pdf
- P2P環(huán)境下排序查詢處理和分類技術(shù)的研究.pdf
- 云計(jì)算環(huán)境下動(dòng)態(tài)負(fù)載均衡算法的研究.pdf
- 云計(jì)算環(huán)境下的入侵檢測(cè)算法研究.pdf
- 基于云計(jì)算環(huán)境下資源調(diào)度算法研究.pdf
- 云計(jì)算環(huán)境下密碼算法模型的研究與實(shí)現(xiàn).pdf
- 云計(jì)算環(huán)境下協(xié)同過(guò)濾推薦算法研究.pdf
- 云計(jì)算環(huán)境下基于資源預(yù)測(cè)的任務(wù)調(diào)度算法研究.pdf
- 移動(dòng)云計(jì)算環(huán)境下移動(dòng)設(shè)備的能量?jī)?yōu)化算法研究.pdf
評(píng)論
0/150
提交評(píng)論