面向軟基帶的高性能并行計算及其體系結構關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩143頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著多媒體應用和無線通信的快速發(fā)展,人們希望通過移動設備獲得更多的服務和更高的傳輸速率,比如實現(xiàn)視頻通話、觀看網(wǎng)絡高清視頻等功能。同時,由于區(qū)域的不同性和無線網(wǎng)絡標準的快速演進,導致目前多種無線通信標準共存發(fā)展的現(xiàn)象,多標準網(wǎng)絡空中接口的無縫連接成為必要,這就要求無線通信信號處理器具有更高的性能和靈活性。傳統(tǒng)的專用集成電路(ASIC)方案能夠提供最優(yōu)的性能功耗比,但較長的設計周期,以及較弱的可編程和可配置性使得其難以兼容多種協(xié)議和適應通

2、信協(xié)議快速發(fā)展的現(xiàn)狀。軟基帶處理器能夠在同一個硬件平臺上通過改變程序來實現(xiàn)不同算法和通信協(xié)議,被認為是未來基帶信號處理器發(fā)展的方向。隨著無線通信標準的不斷演進,數(shù)據(jù)傳輸速率不斷提高,同時協(xié)議之間的差異性也越來越大,其對基帶處理器的吞吐率、靈活性、功耗提出了更高的要求。特別是對于移動設備,由于電池的容量和功率有限,要求基帶處理器具有更高的性能功耗比。這些要求對軟基帶信號處理器的設計帶來了前所未有的挑戰(zhàn)。因此,研究面向軟基帶的高性能、低功耗

3、、可編程的信號處理器體系結構技術具有重要的理論和實際意義。
  本文在分析了多種無線通信協(xié)議特征的前提下,選擇了比較普遍使用的第三代無線通信(3G) WCDMA協(xié)議,以及即將大規(guī)模商用的第四代無線通信(4G) LTE協(xié)議作為研究和實現(xiàn)的對象,對這兩種協(xié)議的基帶處理算法的計算復雜度、并行性、訪存特征進行了詳細的分析,特別地對以OFDM調制解調、MIMO均衡、FIR濾波,卷積算法等算法為代表的高效能體系結構,專用指令集系統(tǒng)、可配置數(shù)據(jù)

4、并行體系結構、多核處理器的核間通信和同步機制等四個方面進行了重點研究。本文主要的研究成果和創(chuàng)新點包括:
  1提出了一種可擴展的,具有固定混洗模式的并行FFT蝶形運算體系結構。本文采用分段處理的方式對FFT算法進行分解,每段包含多個蝶形運算組。向量處理以蝶形運算組為計算單位,每次只有在蝶形運算組的開始與結束才訪問數(shù)據(jù)存儲器,而蝶形運算組內計算的數(shù)據(jù)保存在本地寄存器當中,這種方法有效地減少了訪存次數(shù),從而降低了計算功耗。同時,通過調

5、整FFT數(shù)據(jù)流圖,使得蝶形運算組內具有固定的混洗模式,簡化了向量處理單元之間的數(shù)據(jù)混洗模式和程序映射。并且在蝶形運算組內采用常數(shù)乘法器實現(xiàn)復數(shù)乘法,進一步降低了處理器的運算功耗。實驗結果表明,本文所提出的并行FFT蝶形運算結構獲得了 lllnJ/FFT的計算效能,優(yōu)于當前的其他FFT處理結構,同時面積開銷也較小。
  2提出了一種面向MIMO均衡算法的高效率,高吞吐率的并行運算結構。針對MIMO均衡算法當中大量的小規(guī)模矩陣計算,本

6、文采用One Tone Per Lane(OMPL)策略進行映射,有效地減少向量處理單元之間的數(shù)據(jù)傳輸量。同時提出了一種可配置的本地寄存器文件,其能夠對2x2的矩陣數(shù)據(jù)同時進行和列訪問,而整個寄存器文件只有兩個寫端口和兩個讀端口,結合向量處理單元的復數(shù)向量運算,在運行4x4天線配置和64QAM調制的MIMO均衡算法時,矩陣逆運算吞吐率達到95MInVerSion/S,高于傳統(tǒng)方案近一倍。同時處理器的面積效率(吞吐率除以面積)的提升超過了

7、100%,系統(tǒng)整體吞吐率達到300MbpS,滿足LTE協(xié)議的要求。
  3提出了基于軟基帶信號處理的統(tǒng)一并行計算架構-USCA,其采用超長指令字(Very Large Instruction Word,VLIW)和單指令流多數(shù)據(jù)流(Single Instruction Multiple Data,SIMD)技術開發(fā)目標應用的指令級并行和數(shù)據(jù)級并行。USCA采用了標量和向量的混合控制和處理模式,支持純標量、純向量以及標量向量混合執(zhí)行

8、的三種運算模式。并且針對算法中要求不同的數(shù)據(jù)處理粒度,本文提出一種可配置的向量處理器單元,SIMD功能單元可以根據(jù)不同指令進行動態(tài)配置,支持字節(jié)向量、半字向量、復數(shù)向量的運算操作。同時,設計中充分利用了資源共享來減少硬件面積,提高硬件的利用率,并保持系統(tǒng)的靈活性。實驗結果表明,USCA并行體系結構的運算性能和效能分別達到130Gops和323Mops/s,相比于其他參考文獻,U S C A具有更高的計算性能和效率,并且算法映射過程更加簡

9、單。
  4提出了一種面向軟基帶的多核處理器體系結構,實現(xiàn)了一種基于分布式共享存儲的高效核間同步機制和快速核間通信機制。核間同步機制采用一個小容量的共享便簽式存儲器作為存儲介質,結合信號燈的控制思想實現(xiàn)同步。其以較小的面積開銷提供了點到點、點對多、多對一同步機制??焖俸碎g通信機制CoDMA能夠實現(xiàn)核間數(shù)據(jù)的高速傳輸,并且對于核間連續(xù)等量數(shù)據(jù)交換操作,支持核間雙向數(shù)據(jù)傳輸,在不開辟臨時緩沖區(qū)的情況下,直接在原數(shù)據(jù)地址進行數(shù)據(jù)交換。實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論