基于CMP+GPU異構(gòu)計(jì)算系統(tǒng)的并行離散事件仿真優(yōu)化技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩136頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著仿真應(yīng)用的不斷深入,仿真規(guī)模越來越大,模型越來越復(fù)雜,導(dǎo)致其對(duì)計(jì)算能力的需求越來越高,如何縮短仿真的運(yùn)行時(shí)間,滿足時(shí)效性的需求,是一個(gè)亟待研究的問題。近年來,由CMP和GPU構(gòu)建的異構(gòu)計(jì)算系統(tǒng),具有強(qiáng)大計(jì)算能力、低功耗以及可持續(xù)增長(zhǎng)等特點(diǎn),正成為新一代高效能計(jì)算機(jī)發(fā)展的重要方向,同時(shí)也為加速仿真應(yīng)用帶來了重要的機(jī)遇。然而,當(dāng)前并行仿真系統(tǒng)多以傳統(tǒng)的共享存儲(chǔ)多處理機(jī)和集群為目標(biāo)體系結(jié)構(gòu),難以針對(duì)多/眾核化、異構(gòu)化等特點(diǎn)有效利用CMP和

2、GPU的計(jì)算資源。因此,開展基于CMP+GPU異構(gòu)計(jì)算系統(tǒng)的并行離散事件仿真優(yōu)化技術(shù)研究,對(duì)于充分利用計(jì)算資源、提高仿真運(yùn)行效率、滿足仿真時(shí)效性要求等具有十分重要的理論意義和實(shí)用價(jià)值。
  論文針對(duì)當(dāng)前并行離散事件仿真存在的尚未充分發(fā)揮CMP的優(yōu)勢(shì),難以有效支持基于GPU的離散事件仿真以及CMP+GPU協(xié)同效率低下等問題,在深入分析處理器微體系結(jié)構(gòu)特點(diǎn)和離散事件仿真應(yīng)用特征的基礎(chǔ)上,對(duì)面向CMP的并行仿真內(nèi)核優(yōu)化、基于GPU的存儲(chǔ)

3、管理算法、時(shí)間管理算法以及CMP+GPU協(xié)同機(jī)制等進(jìn)行了深入研究,主要工作和創(chuàng)新點(diǎn)如下:
 ?。?)提出了一種基于CMP的層次化并行仿真內(nèi)核模型?,F(xiàn)有并行仿真內(nèi)核常常以多進(jìn)程方式使用多核資源,存在較大的同步和通信開銷,無法深入發(fā)掘多核處理器潛能。針對(duì)這一問題,提出了一種層次化并行仿真內(nèi)核模型HPSK,以多線程架構(gòu)進(jìn)行仿真調(diào)度和事件執(zhí)行,并重點(diǎn)對(duì)時(shí)間管理服務(wù)和事件管理服務(wù)進(jìn)行優(yōu)化:(i)基于混合時(shí)間推進(jìn)模式,提出最小發(fā)送時(shí)戳計(jì)算協(xié)議

4、。該協(xié)議將同步計(jì)算分割為預(yù)備態(tài)和計(jì)算態(tài),由各個(gè)線程異步地參與時(shí)間同步計(jì)算,僅記錄發(fā)送到計(jì)算態(tài)消息的時(shí)戳,在確保正確性的前提下支持高效的時(shí)間同步。(ii)基于并行離散仿真事件交互的特點(diǎn),提出無鎖創(chuàng)建,異步提交和指針通信的事件管理算法,以最小化線程之間的鎖開銷和減少內(nèi)存的消耗。實(shí)驗(yàn)表明,采用上述優(yōu)化服務(wù)的HPSK具有很好的加速效果和可擴(kuò)展性。特別在事件局部率和前瞻值較低的情況下,可獲得相比于多進(jìn)程仿真內(nèi)核8x的相對(duì)加速比。
 ?。?)

5、提出了一種基于GPU的并行離散事件仿真存儲(chǔ)管理算法?;贕PU的離散事件仿真中,存在動(dòng)態(tài)不規(guī)則的存儲(chǔ)空間需求,難以存儲(chǔ)于相對(duì)規(guī)則的GPU數(shù)據(jù)結(jié)構(gòu)中,且深度并發(fā)的存儲(chǔ)空間分配請(qǐng)求將導(dǎo)致大量的線程沖突,使得仿真事件的存儲(chǔ)管理十分困難。針對(duì)這一問題,提出了一種基于入口映射的并行離散事件仿真存儲(chǔ)管理算法 AMM。AMM算法集成一個(gè)具有“單射”和“概率均等”特性的入口映射來控制線程訪問存儲(chǔ)資源,“單射”特性保證每個(gè)線程分配到唯一的存儲(chǔ)空間訪問入口

6、,支持深度并發(fā)的存儲(chǔ)空間分配請(qǐng)求;“概率均等”特性確保仿真事件均衡地存放在存儲(chǔ)空間中。實(shí)驗(yàn)表明,AMM算法能夠顯著降低存儲(chǔ)消耗和提高運(yùn)行效率。
  (3)提出了一種基于GPU的并行離散事件仿真時(shí)間管理算法。GPU擁有數(shù)百個(gè)可并行處理的運(yùn)算單元,其性能高度依賴于并行度。但傳統(tǒng)的保守時(shí)間管理算法過于悲觀,極大地限制了可并行處理事件的數(shù)目,無法有效發(fā)掘 GPU性能。針對(duì)這一問題,提出了一種基于擴(kuò)展輔助的保守時(shí)間管理算法ESCTM。算法利

7、用運(yùn)行時(shí)信息擴(kuò)展可安全執(zhí)行事件的時(shí)間界限以提高可并行執(zhí)行的事件數(shù)量,同時(shí)采用模擬退火算法動(dòng)態(tài)地調(diào)整參數(shù)來控制事件擴(kuò)展次數(shù)以避免過度擴(kuò)展,從而確保在不同條件下算法都能在高并行度和過度擴(kuò)展之間取得平衡。實(shí)驗(yàn)表明,相比傳統(tǒng)保守時(shí)間管理算法,ESCTM算法可獲得多達(dá)30%的性能提升。
 ?。?)提出了面向并行離散事件仿真的CMP和GPU協(xié)同機(jī)制。GPU內(nèi)核函數(shù)需要由某個(gè)CPU線程(主機(jī)線程)來調(diào)度,容易加重該線程工作負(fù)載,造成CPU線程間

8、負(fù)載不均衡,且大量消息交互容易成為系統(tǒng)瓶頸,導(dǎo)致協(xié)同效率低下。針對(duì)這一問題,提出了一種面向并行離散事件仿真的CMP和GPU協(xié)同機(jī)制CoopCG。該機(jī)制將事件處理任務(wù)和GPU調(diào)度任務(wù)分離,由各個(gè)CPU線程動(dòng)態(tài)地獲取GPU的控制權(quán)分擔(dān)負(fù)載,以實(shí)現(xiàn)CPU線程之間負(fù)載平衡;同時(shí),通過二級(jí)緩存方法降低通信開銷,由一級(jí)緩存處理高度并發(fā)的訪存操作,然后通過并行前綴和計(jì)算剔除無效數(shù)據(jù)后存入二級(jí)緩存進(jìn)行數(shù)據(jù)傳輸,可有效降低數(shù)據(jù)傳輸量。實(shí)驗(yàn)表明,CoopC

9、G能有效利用CMP和GPU資源,具有良好的可擴(kuò)展性。在4核CPU+GPU配置下,可獲得相比于單核CPU約24.87-67.34x的并行加速比。
  在上述研究成果的基礎(chǔ)上,論文在課題組研制的YH-SUPE并行離散事件仿真支撐環(huán)境的基礎(chǔ)上,設(shè)計(jì)實(shí)現(xiàn)了一個(gè)支持 CMP+GPU異構(gòu)計(jì)算系統(tǒng)的并行仿真支撐環(huán)境 CGSUPE;通過人群暴動(dòng)模型對(duì)其進(jìn)行了綜合測(cè)試,結(jié)果表明論文提出的仿真優(yōu)化方法在4核CPU+1GPU配置下可獲得相比于4核CPU

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論