基于LISA的定制處理器研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-10 格式：pdf 頁數(shù)：120 大?。?.28MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩119頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著通信、視頻等高復(fù)雜度應(yīng)用的出現(xiàn)，通用CPU已無法滿足計(jì)算密集型嵌入式應(yīng)用的要求，單純通過提高處理器主頻達(dá)到性能提升，勢(shì)必會(huì)引起整個(gè)嵌入式系統(tǒng)功耗增加；單純使用ASIC設(shè)計(jì)，則會(huì)使系統(tǒng)靈活性下降。針對(duì)目標(biāo)應(yīng)用定制處理器，可以在性能、功耗、成本和靈活性等多個(gè)方面獲得最佳的平衡。指令集擴(kuò)展并精確評(píng)估其性能是定制處理器設(shè)計(jì)的關(guān)鍵環(huán)節(jié)，分析目標(biāo)應(yīng)用算法采用手工指令集擴(kuò)展和等待處理器硬件設(shè)計(jì)完成再評(píng)估其性能必然會(huì)影響處理器的設(shè)計(jì)周期。自動(dòng)指令集

2、擴(kuò)展技術(shù)通過自動(dòng)分析目標(biāo)應(yīng)用程序，快速搜索程序中滿足約束的結(jié)構(gòu)，獲得候選指令集，再在候選指令集中選擇出能夠有效提升處理器性能的指令，并通過結(jié)構(gòu)描述語言建立精確的處理器模型，在設(shè)計(jì)之初快速精確的評(píng)估處理器性能，可以大大縮短處理器的設(shè)計(jì)周期。
　　本文建立了基于結(jié)構(gòu)描述語言LISA的周期精確的基本處理器模型，包括：存儲(chǔ)器子模型、資源子模型、行為子模型、指令集子模型和時(shí)序子模型。指令集子模型使用Analog Devices(ADI)

3、公司的16位處理器ADSP2191指令集作為基本指令集，包括：ALU指令、MAC指令、Shifter指令、Multifunction指令、Data Move指令和Program Flow指令。設(shè)計(jì)了搭建虛擬原型平臺(tái)需要的周期精確的EMI模型和SDRAM模型。虛擬原型平臺(tái)是處理器模型優(yōu)化、目標(biāo)應(yīng)用程序優(yōu)化和自動(dòng)指令集擴(kuò)展的基礎(chǔ)。
　　在候選指令集生成過程中，本文提出了基于關(guān)系矩陣的候選指令集生成算法，加速候選指令集的生成。關(guān)系矩

4、陣代表了程序數(shù)據(jù)流圖中各個(gè)頂點(diǎn)之間的關(guān)系，對(duì)于沒有關(guān)系的頂點(diǎn)，在建立搜索二叉樹時(shí)次序可以調(diào)換，因而它們對(duì)當(dāng)前節(jié)點(diǎn)子樹的影響相同。算法保證對(duì)當(dāng)前節(jié)點(diǎn)搜索時(shí)，與其相關(guān)的節(jié)點(diǎn)都已搜索結(jié)束，如果與當(dāng)前節(jié)點(diǎn)相關(guān)的兩個(gè)節(jié)點(diǎn)中有一個(gè)不滿足約束條件，并且當(dāng)前節(jié)點(diǎn)相對(duì)于相關(guān)節(jié)點(diǎn)引入的兩個(gè)新頂點(diǎn)無關(guān)，那么當(dāng)前節(jié)點(diǎn)肯定不滿足約束條件，可以忽略其子樹的搜索，因此算法可以大大減少搜索不滿足約束條件的節(jié)點(diǎn)個(gè)數(shù)。與Atasu算法相比，在MP3解碼中的子帶綜合示例、M

5、PEG4解碼中的IDCT示例、ADPCM解碼示例、MD5算法示例、FFF變換示例和YUV2RGB示例的候選指令集生成過程中，獲得了相同的滿足約束的節(jié)點(diǎn)數(shù)，在定義不同的輸出約束條件下，搜索不滿足約束節(jié)點(diǎn)的個(gè)數(shù)平均減少79％、40％、82％、41％、59％、60％。
　　在候選指令選擇過程中，本文提出了基于空間限定算法的候選指令選擇方法，加快候選指令的選擇。算法建立以候選指令為頂點(diǎn)的搜索二叉樹，通過先判斷每個(gè)子樹能夠獲得的性能上限

6、，決定是否搜索當(dāng)前子樹，達(dá)到加快搜索的目的。如果當(dāng)前節(jié)點(diǎn)的性能上限已小于或等于目前記錄的最優(yōu)性能，則整個(gè)子樹不需要再搜索。子樹性能上限的判斷是通過先對(duì)候選指令按照單位面積性能參數(shù)從大到小排序，因此總能從可選指令集中先選到參數(shù)最大的候選指令，當(dāng)候選指令不能選中時(shí)，則考慮部分選中，雖然不是可行的選擇，但可以計(jì)算出當(dāng)前子樹能夠獲得的性能上限。與Clark啟發(fā)式貪婪算法相比，本文算法是精確算法，在MP3解碼中的子帶綜合示例、MPEG4解碼中的I

7、DCT示例、ADPCM解碼示例、MD5算法示例、FFT變換示例和YUV2RGB示例的候選指令選擇過程中，都搜索出了性能更優(yōu)的指令擴(kuò)展，并且比完全搜索所有節(jié)點(diǎn)平均減少搜索節(jié)點(diǎn)數(shù)97.76％。
　　本文通過在ARM ESL虛擬原型平臺(tái)上處理器模型運(yùn)行在66MHz頻率下連續(xù)解碼20幀MP3文件進(jìn)行驗(yàn)證。相對(duì)于16位ADSP2191基本處理器模型，擴(kuò)展為32位處理器模型后解碼需要的周期數(shù)減少57.9％，擴(kuò)展向量乘法特殊指令后，解碼需要

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于LISA的定制處理器研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于LISA的定制處理器研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載