

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著通信、視頻等高復(fù)雜度應(yīng)用的出現(xiàn),通用CPU已無法滿足計(jì)算密集型嵌入式應(yīng)用的要求,單純通過提高處理器主頻達(dá)到性能提升,勢(shì)必會(huì)引起整個(gè)嵌入式系統(tǒng)功耗增加;單純使用ASIC設(shè)計(jì),則會(huì)使系統(tǒng)靈活性下降。針對(duì)目標(biāo)應(yīng)用定制處理器,可以在性能、功耗、成本和靈活性等多個(gè)方面獲得最佳的平衡。指令集擴(kuò)展并精確評(píng)估其性能是定制處理器設(shè)計(jì)的關(guān)鍵環(huán)節(jié),分析目標(biāo)應(yīng)用算法采用手工指令集擴(kuò)展和等待處理器硬件設(shè)計(jì)完成再評(píng)估其性能必然會(huì)影響處理器的設(shè)計(jì)周期。自動(dòng)指令集
2、擴(kuò)展技術(shù)通過自動(dòng)分析目標(biāo)應(yīng)用程序,快速搜索程序中滿足約束的結(jié)構(gòu),獲得候選指令集,再在候選指令集中選擇出能夠有效提升處理器性能的指令,并通過結(jié)構(gòu)描述語言建立精確的處理器模型,在設(shè)計(jì)之初快速精確的評(píng)估處理器性能,可以大大縮短處理器的設(shè)計(jì)周期。
本文建立了基于結(jié)構(gòu)描述語言LISA的周期精確的基本處理器模型,包括:存儲(chǔ)器子模型、資源子模型、行為子模型、指令集子模型和時(shí)序子模型。指令集子模型使用Analog Devices(ADI)
3、公司的16位處理器ADSP2191指令集作為基本指令集,包括:ALU指令、MAC指令、Shifter指令、Multifunction指令、Data Move指令和Program Flow指令。設(shè)計(jì)了搭建虛擬原型平臺(tái)需要的周期精確的EMI模型和SDRAM模型。虛擬原型平臺(tái)是處理器模型優(yōu)化、目標(biāo)應(yīng)用程序優(yōu)化和自動(dòng)指令集擴(kuò)展的基礎(chǔ)。
在候選指令集生成過程中,本文提出了基于關(guān)系矩陣的候選指令集生成算法,加速候選指令集的生成。關(guān)系矩
4、陣代表了程序數(shù)據(jù)流圖中各個(gè)頂點(diǎn)之間的關(guān)系,對(duì)于沒有關(guān)系的頂點(diǎn),在建立搜索二叉樹時(shí)次序可以調(diào)換,因而它們對(duì)當(dāng)前節(jié)點(diǎn)子樹的影響相同。算法保證對(duì)當(dāng)前節(jié)點(diǎn)搜索時(shí),與其相關(guān)的節(jié)點(diǎn)都已搜索結(jié)束,如果與當(dāng)前節(jié)點(diǎn)相關(guān)的兩個(gè)節(jié)點(diǎn)中有一個(gè)不滿足約束條件,并且當(dāng)前節(jié)點(diǎn)相對(duì)于相關(guān)節(jié)點(diǎn)引入的兩個(gè)新頂點(diǎn)無關(guān),那么當(dāng)前節(jié)點(diǎn)肯定不滿足約束條件,可以忽略其子樹的搜索,因此算法可以大大減少搜索不滿足約束條件的節(jié)點(diǎn)個(gè)數(shù)。與Atasu算法相比,在MP3解碼中的子帶綜合示例、M
5、PEG4解碼中的IDCT示例、ADPCM解碼示例、MD5算法示例、FFF變換示例和YUV2RGB示例的候選指令集生成過程中,獲得了相同的滿足約束的節(jié)點(diǎn)數(shù),在定義不同的輸出約束條件下,搜索不滿足約束節(jié)點(diǎn)的個(gè)數(shù)平均減少79%、40%、82%、41%、59%、60%。
在候選指令選擇過程中,本文提出了基于空間限定算法的候選指令選擇方法,加快候選指令的選擇。算法建立以候選指令為頂點(diǎn)的搜索二叉樹,通過先判斷每個(gè)子樹能夠獲得的性能上限
6、,決定是否搜索當(dāng)前子樹,達(dá)到加快搜索的目的。如果當(dāng)前節(jié)點(diǎn)的性能上限已小于或等于目前記錄的最優(yōu)性能,則整個(gè)子樹不需要再搜索。子樹性能上限的判斷是通過先對(duì)候選指令按照單位面積性能參數(shù)從大到小排序,因此總能從可選指令集中先選到參數(shù)最大的候選指令,當(dāng)候選指令不能選中時(shí),則考慮部分選中,雖然不是可行的選擇,但可以計(jì)算出當(dāng)前子樹能夠獲得的性能上限。與Clark啟發(fā)式貪婪算法相比,本文算法是精確算法,在MP3解碼中的子帶綜合示例、MPEG4解碼中的I
7、DCT示例、ADPCM解碼示例、MD5算法示例、FFT變換示例和YUV2RGB示例的候選指令選擇過程中,都搜索出了性能更優(yōu)的指令擴(kuò)展,并且比完全搜索所有節(jié)點(diǎn)平均減少搜索節(jié)點(diǎn)數(shù)97.76%。
本文通過在ARM ESL虛擬原型平臺(tái)上處理器模型運(yùn)行在66MHz頻率下連續(xù)解碼20幀MP3文件進(jìn)行驗(yàn)證。相對(duì)于16位ADSP2191基本處理器模型,擴(kuò)展為32位處理器模型后解碼需要的周期數(shù)減少57.9%,擴(kuò)展向量乘法特殊指令后,解碼需要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 多核網(wǎng)絡(luò)處理器中定制控制處理器關(guān)鍵技術(shù)研究.pdf
- 定制指令與協(xié)處理器加速機(jī)制的研究.pdf
- ASIP處理器中定制指令映射技術(shù)研究.pdf
- 面向處理器定制的模擬器快速生成方法.pdf
- 基于自主嵌入式處理器的半自定制物理設(shè)計(jì)方法研究.pdf
- 基于憶阻器的處理器結(jié)構(gòu)的研究.pdf
- 基于圖形處理器的SIFT算法研究.pdf
- 基于Cell處理器的信號(hào)處理加速技術(shù)研究.pdf
- 單處理器及多處理器系統(tǒng)節(jié)能技術(shù)的研究.pdf
- 基于SMT技術(shù)的微處理器結(jié)構(gòu)研究.pdf
- 基于fpga的微處理器設(shè)計(jì)
- 基于Tilera多核處理器的并行模型研究.pdf
- 基于流密碼的安全處理器架構(gòu)研究.pdf
- 基于多核處理器的節(jié)能調(diào)度算法研究.pdf
- 基于圖形處理器的聚類分析算法研究.pdf
- 基于FPGA的FFT處理器的實(shí)現(xiàn).pdf
- 基于FPGA的FFT處理器的設(shè)計(jì).pdf
- 基于FPGA的視頻圖像處理器.pdf
- 基于堆棧處理器的SOPC的研究與實(shí)現(xiàn).pdf
- 安全處理器研究.pdf
評(píng)論
0/150
提交評(píng)論