基于CUDA的大規(guī)模線性稀疏方程組求解器的設計.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：81 大?。?.13MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩80頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

1、大規(guī)模線性方程組的求解一直都是科學計算里的重要問題。隨著圖形處理器(GPU)硬件架構(gòu)的不斷發(fā)展，GPU的功能已經(jīng)衍生到GPU通用計算領域。GPU作為CPU的協(xié)處理器完成大規(guī)模密集型計算任務，計算能力與小規(guī)模的集群相當。相比集群，GPU在功耗和成本上占有優(yōu)勢。2007年NVIDIA推出CUDA并行計算平臺，降低了使用 GPU加速計算的難度，科員人員可以更方便的使用 GPU加速計算科研中的問題，這使得越來越多的領域開始引入GPU計算。

2、>　　本文在CUDA平臺上，在GPU上實現(xiàn)大規(guī)模的稀疏線程方程組的求解。對于大規(guī)模的稀疏矩陣采用CSR存儲。方程組的求解采用共軛梯度算法(CG)求解。共軛梯度法中的稀疏矩陣矢量乘(SpMV)、矢量內(nèi)積操作和矢量加減操作采用GPU計算。其中SpMV和矢量內(nèi)積自己動手編程相應代碼，矢量加減采用NVIDIA提供的CUBLAS庫函數(shù)來實現(xiàn)。在本文的稀疏矩陣是對稱正定，在CSR存儲時只存儲上三角數(shù)據(jù)。在對上三角的數(shù)據(jù)SpMV操作時，把SpMV分解

3、為乘法和加法操作。在計算矩陣下三角的 SpMV需要利用存儲的上三角數(shù)據(jù)。在設計的算法中，引入原子操作來避免多個線程同一時刻對同一地址讀寫。目前GPU顯存最大只有6GB，需要對大規(guī)模的稀疏矩陣分塊處理。設計有別于常見的矩陣均分分塊算法，該算法根據(jù)GPU顯存的限制裝載適量數(shù)據(jù)到GPU中，提高GPU的利用率。矢量內(nèi)積操作在GPU規(guī)約中采用增加偏移量的辦法來避免bank沖突，從而提高程序性能。實現(xiàn)的GPU矢量內(nèi)積操作比NVIDIA自帶的CUBL

4、AS效率要高。最后在CG算法上添加雅克比預處理(JP),采用雅克比預處理共軛梯度法(JPCG)求解方程組.
　　在用GTX480的顯卡和i5的CPU硬件平臺上，通過對多組不同規(guī)模的稀疏矩陣性能分析，在相比CPU的計算結(jié)果，GPU實現(xiàn)的SpMV操作可以獲得30倍的加速，矢量內(nèi)積在測試數(shù)據(jù)下有6倍的加速，對于整個求解過程加速比最高有46倍的加速。這也表明使用GPU求解方程組可以獲得比較好的求解效率。程序能夠自動適應不同規(guī)模大小的稀疏矩

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于CUDA的大規(guī)模線性稀疏方程組求解器的設計.pdf

文檔簡介

溫馨提示

最新文檔

評論

基于CUDA的大規(guī)模線性稀疏方程組求解器的設計.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載