版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、近年來,信息社會的飛速發(fā)展引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長,大數(shù)據(jù)問題逐漸引起了研究者的廣泛關注。然而,大數(shù)據(jù)問題表現(xiàn)出與傳統(tǒng)科學計算問題不同的負載特性,使得通用處理器面臨嚴峻挑戰(zhàn)。圖問題是大數(shù)據(jù)中的典型問題,在分析大數(shù)據(jù)集中數(shù)據(jù)對象間的關系中扮演著重要角色,尤其是以BFS算法為代表的圖搜索算法,更是廣泛存在于社交網(wǎng)絡、人工智能等眾多領域??紤]到流處理器高性能、高效能等特點,探索基于流體系結構解決圖搜索大數(shù)據(jù)問題具有重要的意義。因此,本課題以
2、特定的流加速部件為研究平臺,面向圖搜索大數(shù)據(jù)問題,研究其片上數(shù)據(jù)通路的設計和優(yōu)化。
針對該流加速部件,本文在深入分析其執(zhí)行圖搜索算法時負載特性的基礎上,重點研究了其片上數(shù)據(jù)通路的設計與優(yōu)化,主要從以下四個方面展開研究:
第一,針對已有流處理器中的SRF數(shù)據(jù)通路,分析其在解決圖搜索問題時多線程訪問SRF激烈競爭的不足,提出了多體多控制器的SRF結構,增加SRF的并行度,并基于AXI協(xié)議實現(xiàn)了SRF中的體與處理器中的核之
3、間的交叉互連。該數(shù)據(jù)通路能夠均衡處理多線程訪問SRF的請求,且具有較好的吞吐帶寬,有效適應了處理器核對SRF的細粒度訪問。
第二,通過深入分析該流加速部件在執(zhí)行圖搜索算法時訪問SRF的負載特性,進一步優(yōu)化SRF數(shù)據(jù)通路,提出了處理器核私有SRF中的體方法,避免了它們之間復雜的交叉互連,提升了流加速部件的整體性能。
第三,分析已有流處理器中的訪存數(shù)據(jù)通路,針對其不適合多線程細粒度訪存的問題,設計了基于消息包的高并發(fā)、低
4、延遲的訪存數(shù)據(jù)通路,該方法不僅能夠均衡處理各線程的訪存請求,而且也具有較好的訪存帶寬和延遲,滿足了多線程處理圖搜索問題的需求。
第四,針對圖搜索算法中共享數(shù)據(jù)一致性的問題,首先探索了通過加解鎖SPM來維護一致性的方法,但發(fā)現(xiàn)該方法會導致訪問SPM的激烈沖突。然后,進一步研究了多線程執(zhí)行圖搜索算法時訪問共享數(shù)據(jù)的特性,提出了在訪存數(shù)據(jù)通路中加入事務型訪存的機制,通過原子性操作內(nèi)存中的共享數(shù)據(jù)來保護其一致性,避免了頻繁訪問SPM的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向大數(shù)據(jù)的流處理器數(shù)據(jù)通路結構優(yōu)化.pdf
- 面向通信應用的可重構系統(tǒng)數(shù)據(jù)通路設計與優(yōu)化.pdf
- 一種DSP數(shù)據(jù)通路的設計實現(xiàn).pdf
- 基于數(shù)據(jù)通路的FPGA布圖系統(tǒng).pdf
- 基于VMM的數(shù)據(jù)通路驗證平臺的設計.pdf
- 基于數(shù)據(jù)通路各運算部件的通用數(shù)字信號處理器設計與實現(xiàn).pdf
- MSTP中彈性分組環(huán)MAC數(shù)據(jù)通路的設計.pdf
- 32位浮點DSP數(shù)據(jù)通路的研究與設計.pdf
- AHB-PC Card橋IP核數(shù)據(jù)通路設計與實現(xiàn).pdf
- LTE終端IPv4-IPv6數(shù)據(jù)通路的研究與實現(xiàn).pdf
- 兼容TMS320C54xDSP數(shù)據(jù)通路設計.pdf
- sata2.0硬盤加解密接口芯片數(shù)據(jù)通路的設計與fpga實現(xiàn)(1)
- pcie2.0mac層數(shù)據(jù)通路與pcs層設計
- sata2.0硬盤加解密接口芯片數(shù)據(jù)通路的設計與fpga實現(xiàn)
- 基于MIPS指令集的RISC微處理器數(shù)據(jù)通路的設計與實現(xiàn).pdf
- A-CORE體系結構分析——處理器數(shù)據(jù)通路設計.pdf
- 基于pcie2.0的萬兆網(wǎng)卡中數(shù)據(jù)通路的設計
- 一種基于最小和算法LDPC譯碼器數(shù)據(jù)通路的設計與實現(xiàn).pdf
- 數(shù)字信號處理器低功耗數(shù)據(jù)通路的研究.pdf
- 功耗限制下RTL數(shù)據(jù)通路低費用測試方法研究.pdf
評論
0/150
提交評論