1、傳統(tǒng)單核架構(gòu)下,“存儲墻”問題已成為性能提升的瓶頸之一。異構(gòu)多核系統(tǒng)芯片系統(tǒng)中,數(shù)據(jù)的存儲、傳輸與交換需要更加高效的存儲架構(gòu),導(dǎo)致存儲與計算之間的矛盾更加突出。尤其在高密度計算類應(yīng)用中,轉(zhuǎn)置類運算占據(jù)較大比重,如何設(shè)計高效的轉(zhuǎn)置運算單元對SoC整體性能有重要作用。
本文在基于二維網(wǎng)格NoC的多核SoC環(huán)境下,設(shè)計基于DDR2/DDR3存儲器的接口電路及轉(zhuǎn)置電路,研究實現(xiàn)高效的大矩陣轉(zhuǎn)置方法。
論文的主要工作如下:
2、r> 1.設(shè)計實現(xiàn)基于包-電路連接協(xié)議的SDRAM接口電路。整體結(jié)構(gòu)由輸入信號處理模塊、輸出信號處理模塊、異步FIFO調(diào)用及DDR2/DDR3 SDRAM控制器組成,其中輸入與輸出信號處理模塊實現(xiàn)網(wǎng)絡(luò)包與存儲器時序的匹配,異步FIFO實現(xiàn)跨時鐘域的傳輸,DDR2/DDR3 SDRAM控制器將時序信號轉(zhuǎn)換成存儲器可以識別的信號,并發(fā)送到存儲器。
2.設(shè)計一種基于分塊式轉(zhuǎn)置算法的的轉(zhuǎn)置簇。針對現(xiàn)有矩陣轉(zhuǎn)置算法中效率較低的問題,設(shè)
3、計基于分塊式轉(zhuǎn)置算法,并用Verilog RTL實現(xiàn)轉(zhuǎn)置簇。轉(zhuǎn)置簇通過控制外部存儲器地址,讀寫存儲空間每個分塊內(nèi)的數(shù)據(jù),可以實現(xiàn)行寫行讀操作,且突發(fā)傳輸?shù)乃袛?shù)據(jù)均可以作為有效數(shù)據(jù)。分析結(jié)果得出基于DDR2 SDRAM存儲器的分塊式算法效率相比分塊映射算法效率提高36.5%。
3.提出一種補齊式準原地轉(zhuǎn)置算法。針對現(xiàn)有分塊轉(zhuǎn)置算法中的存儲空間利用低的問題,利用方陣對角線對稱位置小塊數(shù)據(jù)互換的思想實現(xiàn)大規(guī)模矩陣的原地轉(zhuǎn)置,提出一