2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、云計算技術(shù)的快速發(fā)展使得云計算平臺成為支持 IaaS的基礎(chǔ)性設(shè)施,為用戶提供大規(guī)模的虛擬化資源。分布式計算框架如MapReduce和云計算技術(shù)相結(jié)合使得對海量數(shù)據(jù)進(jìn)行挖掘與分析成為可能,直接促進(jìn)了大數(shù)據(jù)時代的到來。
  本文基于典型的分布式云計算平臺深入研究了虛擬機集群的版本控制問題,同時圍繞MapReduce分布式計算框架下的作業(yè)實時進(jìn)度估計和面向作業(yè)時限的任務(wù)調(diào)度兩個問題開展了研究。本文主要工作具體如下:
  針對已有方

2、法在處理版本控制問題時,由于需要進(jìn)行不同程度的版本數(shù)據(jù)傳輸和差異數(shù)據(jù)計算,導(dǎo)致耗時長和存儲端負(fù)載壓力大等問題,我們提出了一種新穎的扁平化版本控制方法。該方法在本地增量生成版本,在版本恢復(fù)時使用緩存樹結(jié)構(gòu)按需傳輸版本數(shù)據(jù)。實驗顯示我們的方法能有效地加速大規(guī)模虛擬機集群的版本控制過程,同時將負(fù)載壓力分散在各節(jié)點,避免了性能瓶頸。
  針對已有方法在對MapReduce作業(yè)進(jìn)度進(jìn)行估計時,由于采取粗粒度的估算方法,或是使用靜態(tài)采樣的方法

3、而未考慮作業(yè)執(zhí)行期間的狀態(tài)動態(tài)變化,導(dǎo)致估計不全面、精度低和實時性不好的問題,我們提出了一種作業(yè)實時進(jìn)度的迭代估計方法。該方法為MapReduce作業(yè)建立三階段模型(Map、非重疊Shuffle和Reduce階段),并在作業(yè)運行期間,基于作業(yè)歷史數(shù)據(jù)和運行狀態(tài)信息來迭代地計算各階段的持續(xù)時間,以準(zhǔn)確地估計出實時的作業(yè)完成時間,并最終將其轉(zhuǎn)換為作業(yè)實時進(jìn)度。實驗結(jié)果表明該方法在反映作業(yè)進(jìn)度實時性變化方面性能提升顯著,同時也有效地提升了作業(yè)

4、實時進(jìn)度的估計精度。
  針對已有方法在為MapReduce作業(yè)提供滿足時限的功能時,出現(xiàn)的無法在時限前完成作業(yè)和無法在時限內(nèi)處理最大數(shù)據(jù)量的問題,我們提出了一種滿足MapReduce作業(yè)時限的任務(wù)調(diào)度方法。該方法在調(diào)度Map任務(wù)時,使用一種面向作業(yè)時限的迭代-逼近的任務(wù)調(diào)度算法以判斷是繼續(xù)還是終止Map階段。終止Map階段后,作業(yè)剩余未完成部分繼續(xù)執(zhí)行,此時該方法使用一種修正算法以進(jìn)一步確保能在時限前完成作業(yè),同時校正處理的數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論