大規(guī)模CFD高效CPU-GPU異構并行計算關鍵技術研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：167 大?。?.00MB 人氣指數(shù)：12 舉報 版權申訴

大規(guī)模CFD高效CPU-GPU異構并行計算關鍵技術研究.pdf_第1頁

已閱讀1頁，還剩166頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、計算流體力學（Computational Fluid Dynamics，CFD）采用數(shù)值計算方法求解流動控制方程以發(fā)現(xiàn)各種流動現(xiàn)象和規(guī)律，已廣泛應用于航空航天等領域。隨著數(shù)值模擬的幾何外形、物理模型日益復雜，流動機理研究越來越精細，CFD計算的規(guī)模和復雜度空前增長，迫切需要利用高性能計算機實現(xiàn)高效CFD并行計算以提升CFD應用效率。
　　近年來，隨著圖像處理器（Graphics Processing Unit，GPU）浮點運算性能

2、和可編程性的提升，采用CPU/GPU異構體系結構成為構造高性能計算機系統(tǒng)的一種趨勢。盡管異構體系結構能夠在兼顧通用性和效能的同時大幅提升系統(tǒng)性能，但復雜的硬件架構要求研究者綜合利用多種編程模型以挖掘多層次并行性，對高效CFD并行應用開發(fā)帶來了極大的挑戰(zhàn)。
　　本文面向CPU/GPU異構體系結構和典型CFD應用，圍繞大規(guī)模、高效CFD異構協(xié)同并行計算關鍵技術開展研究，重點研究了CFD應用異構協(xié)同并行編程框架、并行算法和性能優(yōu)化、負載

3、均衡等問題。論文的工作包括：
　?。?）針對多區(qū)塊結構網格CFD計算的特點，提出了適應大型CPU/GPU異構系統(tǒng)的TLCF三層異構協(xié)同編程框架。綜合MPI、OpenMP和CUDA編程模型，給出了TLCF框架的三種實例：嵌套OpenMP的TLCF框架（NOMP-TLCF）、OpenMP異步執(zhí)行的TLCF框架（OMPAE-TLCF）以及MPI異步執(zhí)行的TLCF框架（MPIAE-TLCF）。通過分析這三種編程框架的優(yōu)缺點，發(fā)現(xiàn)NOMP-

4、TLCF編程框架更適用于大規(guī)模異構并行系統(tǒng)上CFD應用的開發(fā)。
　?。?）針對計算流體力學中格子Boltzmann方程的求解，研究其在CPU/GPU異構并行系統(tǒng)上的并行算法。首先，針對算法中的碰撞、遷移及邊界處理過程，構建了基于網格單元映射的單GPU并行方法；在傳統(tǒng)的依賴共享存儲（AS）算法基礎上，提出直接存儲（AD）算法以適應單GPU訪存方式的發(fā)展。然后，根據CPU和GPU的協(xié)同方式及通信與計算重疊的程度，分別提出了基本并行LB

5、M-base算法、通信與計算重疊并行LBM-overlap算法、CPU/GPU協(xié)同計算并行LBM-hybrid算法。算法性能的理論分析和測試結果表明，相對AS算法，AD算法能采用更多線程配置，獲得更好性能。相對于兩個6核CPU，格子Boltzmann方法在單GPU上可獲得17倍的性能加速比。多計算節(jié)點的并行性能測試結果顯示，相對于單個計算節(jié)點，性能最好的LBM-hybrid并行算法在128個計算節(jié)點上能獲得82.0％并行效率。
　

6、?。?）針對計算流體力學中的Navier-Stokes方程的求解，研究其在CPU/GPU異構并行系統(tǒng)上的并行算法。首先，提出了基于網格單元的細粒度單GPU并行算法；為消除無粘項求解過程中的數(shù)據依賴，提出了冗余計算方法和內核函數(shù)分解方法。然后，基于NOMP-TLCF編程框架提出了基于網格區(qū)塊的粗粒度并行算法，并通過流與異步執(zhí)行的方式重疊數(shù)據傳輸與GPU計算過程，減少CPU與GPU之間數(shù)據傳輸?shù)拈_銷。針對計算節(jié)點內不同處理部件的計算能力和存

7、儲能力的差異，提出了Out-of-Core方法以增加單個節(jié)點上的模擬規(guī)模。進一步的，我們提出了TCBO和TCBL兩種傳輸策略，降低計算節(jié)點間的數(shù)據通信開銷。數(shù)值實驗驗證了異構并行算法的正確性，相對于單核CPU，GPU的性能加速比在8倍左右；相對于兩個6核CPU，單GPU能獲得約1.85倍的性價比優(yōu)勢；強擴展性和弱擴展性測試結果都表明該并行算法有較好的加速比和并行效率。
　?。?）從粗粒度和細粒度兩個方面，研究了CPU/GPU異構并

8、行系統(tǒng)的負載均衡策略。在粗粒度負載均衡方面，對于多區(qū)塊結構網格Navier-Stokes方程的求解，考慮了不同處理單元的計算性能差異以及通信對應用性能影響，提出了基于性能模型的靜態(tài)負載均衡策略。然后，為消除性能模型中的若干假設，提出了基于預取的任務竊取動態(tài)調度算法。實驗測試表明，兩種負載均衡算法都能較好的均衡處理單元之間的負載。在細粒度負載均衡方面，針對稀疏矩陣向量乘的求解，研究其在采用不同稀疏矩陣存儲格式時GPU的性能，指出當矩陣各行

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大規(guī)模CFD高效CPU-GPU異構并行計算關鍵技術研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

大規(guī)模CFD高效CPU-GPU異構并行計算關鍵技術研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載