版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、圖形處理器(GPU:Graphics Processing Unit)傳統(tǒng)上是作為一種外設(shè)用來(lái)加速3D圖形渲染,但隨著其功能和性能的逐步加強(qiáng),如今它已經(jīng)成為一種流行的通用計(jì)算設(shè)備。隨著CPU單核心性能的進(jìn)化陷入瓶頸,同時(shí)多核CPU正在蓬勃發(fā)展,需要把注意力從單線程程序轉(zhuǎn)移到多線程程序上,才能從多核CPU中獲益。這就要求開(kāi)發(fā)者必須設(shè)計(jì)相應(yīng)的并行算法來(lái)代替串行算法?,F(xiàn)代GPU將多核處理器的設(shè)計(jì)思路推向了極致,在一塊芯片上集成了成百上千個(gè)核心
2、。與CPU相比,GPU具有高性能、高能耗比、低成本等優(yōu)勢(shì),因此利用GPU來(lái)提升算法性能得到了廣泛的關(guān)注。
然而,GPU有自己獨(dú)特的編程方式和算法設(shè)計(jì)思想,讓習(xí)慣編寫(xiě)CPU程序的人很容易犯錯(cuò),寫(xiě)出低效的GPU程序。因此需要深入研究GPU全新的編程模型,包括硬件結(jié)構(gòu)、編程環(huán)境、程序執(zhí)行方式以及性能優(yōu)化方法等,對(duì)它們的深入研究和理解是設(shè)計(jì)高性能GPU算法的基礎(chǔ)。在此基礎(chǔ)上,高效實(shí)現(xiàn)了需要在后續(xù)算法中使用到的reduce、scan等原
3、語(yǔ)操作,這些操作對(duì)于所提出算法的性能表現(xiàn)有至關(guān)重要的影響。
圖算法的大數(shù)據(jù)量、高并發(fā)度和高性能要求的特點(diǎn)使其很適合利用GPU進(jìn)行處理,因此近幾年來(lái)基于GPU的圖算法研究成為了一個(gè)熱點(diǎn)。廣度優(yōu)先搜索(BFS:Breadth-First Search)是最底層最基礎(chǔ)的圖算法之一,它一般作為其他復(fù)雜算法的構(gòu)成單元,其性能對(duì)整個(gè)算法會(huì)產(chǎn)生重大影響,因此值得進(jìn)行深入研究?,F(xiàn)有的GPU BFS算法均存在較大的負(fù)載不均問(wèn)題,導(dǎo)致算法的性能受
4、圖結(jié)構(gòu)的影響較大,表現(xiàn)不夠穩(wěn)定。針對(duì)此問(wèn)題提出了一個(gè)新的BFS算法,第一次實(shí)現(xiàn)了完全的負(fù)載均衡。該算法將每一輪BFS循環(huán)分解為兩個(gè)階段:工作重分配與鄰接頂點(diǎn)獲取。工作重分配階段使用一個(gè)并行化的expand操作來(lái)從全局范圍內(nèi)重新組織輸入的工作負(fù)載,然后鄰接頂點(diǎn)獲取階段以負(fù)載均衡的方式實(shí)現(xiàn)對(duì)鄰接頂點(diǎn)的并行訪問(wèn)。實(shí)驗(yàn)結(jié)果表明,對(duì)比CPU上的串行BFS實(shí)現(xiàn)與現(xiàn)有最高效的GPU BFS實(shí)現(xiàn),所提出的算法分別能夠取得最高39倍和1.42倍的性能提升
5、。
強(qiáng)連通分量(SCC:Strongly Connected Component)分解是另一個(gè)基礎(chǔ)圖算法。現(xiàn)有的GPU SCC分解算法基本上是CPU算法的直接移植,沒(méi)有充分考慮GPU的架構(gòu)特性,性能表現(xiàn)受到很大局限。針對(duì)這一問(wèn)題,提出了一個(gè)新的SCC分解算法。它完全基于GPU架構(gòu),以前向和反向可達(dá)集合查詢?yōu)榛A(chǔ),通過(guò)一種迭代形式的分治策略來(lái)識(shí)別每一個(gè)SCC。算法中引入了很多專門(mén)針對(duì)GPU架構(gòu)所設(shè)計(jì)的優(yōu)化方法,如基于BFS的高效
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于GPU并行串匹配算法的研究.pdf
- 基于gpu的并行排序?qū)W習(xí)算法研究
- 基于GPU的并行排序?qū)W習(xí)算法研究.pdf
- 基于GPU的高性能并行優(yōu)化算法研究.pdf
- 基于GPU的并行智能算法.pdf
- 基于GPU的FPGA并行布線算法實(shí)現(xiàn).pdf
- 基于GPU的深度學(xué)習(xí)算法并行化研究.pdf
- 基于GPU的并行人臉識(shí)別算法研究.pdf
- 基于OpenCV的GPU并行加速圖像匹配算法研究.pdf
- 基于GPU的圖像壓縮感知算法并行化研究.pdf
- 基于GPU的并行線性判別分析算法研究.pdf
- 基于GPU加速的RDF查詢并行Join算法.pdf
- 基于GPU的空間并行算法研究與實(shí)現(xiàn).pdf
- 基于GPU的光波導(dǎo)器件FDTD并行算法研究.pdf
- 基于GPU并行計(jì)算的雷達(dá)信號(hào)分選算法研究.pdf
- 基于GPU并行加速碰撞檢測(cè)算法的研究.pdf
- 基于GPU的重采樣并行算法的研究與實(shí)現(xiàn).pdf
- 基于GPU并行化的干細(xì)胞遺傳優(yōu)化算法研究.pdf
- 基于分治策略的背包問(wèn)題GPU并行算法研究.pdf
- 基于GPU的并行連續(xù)蟻群算法及其應(yīng)用研究.pdf
評(píng)論
0/150
提交評(píng)論