版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、現(xiàn)如今,以CPU+GPU為主的異構(gòu)模式被廣泛的使用,06年CUDA編程架構(gòu)的推出大大提高了GPU的可編程性,各領(lǐng)域內(nèi)使用CUDA進(jìn)行加速的應(yīng)用程序大量出現(xiàn)。
CUDA的架構(gòu)中引入了STMD的概念。STMD中在提高硬件資源利用效率的同時(shí)也引入了一些問題。STMD架構(gòu)中引入了Warp的概念,Warp是GPU創(chuàng)建,管理,執(zhí)行的最小單元,Warp有在一個(gè)周期內(nèi)其中所有線程必須執(zhí)行同一條指令的特性,因此在遇到分支等情況時(shí)會產(chǎn)生Contr
2、ol Divergence,嚴(yán)重影響程序的執(zhí)行效率。
本文重點(diǎn)研究方向是如何最大程度上降低分支密集型應(yīng)用在執(zhí)行過程中產(chǎn)生的Control Divergence以提高程序性能。為了解決這個(gè)問題,本文提出了一種基于線程交換的軟件優(yōu)化算法,可以在真實(shí)機(jī)器平臺上應(yīng)用于分支密集型應(yīng)用程序,并能夠有效的降低此類程序中大量存在的Control Divergence,從而提高程序性能,縮短程序運(yùn)行時(shí)間。
1)深入分析了多個(gè)分支密集應(yīng)
3、用產(chǎn)生Control Divergence的具體原理,并對程序按如下標(biāo)準(zhǔn)進(jìn)行分類。(1)易獲得分支特性(Easy-Handled,EH)與不易獲得分支特性(Hard-Handled,HH),(2)線程編號相關(guān)(Thread-Index Dependent,TID)與線程數(shù)據(jù)相關(guān)(Thread-Data Dependent,TDD)。通過這種分類將CUDA程序分為四類,可便于針對每一類進(jìn)行不同的優(yōu)化。
2)提出并設(shè)計(jì)一種基于線程
4、交換的優(yōu)化算法框架,并進(jìn)一步細(xì)化,將其分成直接構(gòu)造映射表優(yōu)化算法(DIMA,Direct Index-Map Algorithm)以及預(yù)處理構(gòu)造映射表算法(PIMA,Pre-process Index-Map Algorithm)。實(shí)驗(yàn)結(jié)果表明,優(yōu)化之后程序的Control Divergence基本降至無,使用線程交換優(yōu)化算法優(yōu)化之后相對與優(yōu)化之前運(yùn)行時(shí)間降低明顯。優(yōu)化之后Kernel的加速比平均有1.5左右,而總體運(yùn)行時(shí)間的加速比平均
5、有1.2左右。
3)DIMA與PIMA算法中參數(shù)的控制可能會對優(yōu)化結(jié)果產(chǎn)生影響。其中對于TID類型的程序線程交換范圍會有影響,對于適用于PIMA算法的程序中,預(yù)處理的次數(shù)也是需要考慮的因素,因此對算法執(zhí)行過程中參數(shù)的控制進(jìn)行測試研究并得出結(jié)論。測試發(fā)現(xiàn),對于不同的程序,由于要進(jìn)行控制Control Divergence與控制不規(guī)則訪存之間的權(quán)衡,線程交換范圍的最優(yōu)解不同。同樣的,對于使用PIMA的程序,最優(yōu)的預(yù)處理次數(shù)也不同。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 分支與不規(guī)則訪存在GPU上的優(yōu)化方法研究.pdf
- SixNy應(yīng)用在硬盤磁頭保護(hù)膜上的研究.pdf
- Caffe應(yīng)用在主從式加速器上的內(nèi)存管理與性能優(yōu)化.pdf
- 基于Sprint CDMA網(wǎng)絡(luò)的QChat應(yīng)用在Android系統(tǒng)上的實(shí)現(xiàn).pdf
- 應(yīng)用在不銹鋼管凝汽器上的水處理藥劑的研究.pdf
- CDC技術(shù)應(yīng)用在ECT數(shù)據(jù)采集的研究.pdf
- 新技術(shù)應(yīng)用在企業(yè)級架構(gòu)藍(lán)圖的規(guī)劃方法研究
- 應(yīng)用在途車模型研究路網(wǎng)容量.pdf
- XLink應(yīng)用在IE中的實(shí)現(xiàn).pdf
- 應(yīng)用在激光測距的ARM SOC設(shè)計(jì).pdf
- cdc技術(shù)應(yīng)用在ect數(shù)據(jù)采集的研究
- 移動應(yīng)用在離散制造業(yè)的應(yīng)用模式研究.pdf
- 守恒法應(yīng)用在金屬的計(jì)算上
- hdmi光端機(jī)成功應(yīng)用在多媒體視頻傳輸項(xiàng)目上
- 淺談應(yīng)用在公路測量中的rtk技術(shù)
- 計(jì)算密集型應(yīng)用在新型眾核處理機(jī)環(huán)境下的實(shí)現(xiàn)及性能.pdf
- 脈沖控制系統(tǒng)應(yīng)用在腫瘤治療中的研究.pdf
- 云應(yīng)用在IT項(xiàng)目溝通管理中的實(shí)踐研究.pdf
- as主要應(yīng)用在熱水系統(tǒng)中的閥
- 激勵—維持理論如何應(yīng)用在員工績效
評論
0/150
提交評論