版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第三章 DSP指令系統(tǒng)與特點,第一節(jié) 數(shù)據(jù)尋址方式,第二節(jié) 程序存儲器地址的生成方式,第三節(jié) 流水線,第四節(jié) 指令系統(tǒng)概述,Smem:16位單尋址操作數(shù)。Xmem:16位雙尋址操作數(shù),從DB數(shù)據(jù)總線上讀出。Ymem:16位雙尋址操作數(shù),從CB數(shù)據(jù)總線上讀出。dmad:16位立即數(shù),數(shù)據(jù)存儲器地址。pmad:16位立即數(shù),程序存儲器地址。PA: 16位立即數(shù),I/O口地址。src: 源累加器(A或B)。dst:
2、目的累加器(A或B)。lk: 16位長立即數(shù)。,第一節(jié) TMS320C54x的數(shù)據(jù)尋址方式,1.立即數(shù)尋址2.絕對地址尋址3.累加器尋址4.直接尋址5.間接尋址6.存儲器映象寄存器尋址7.堆棧尋址,尋址分類,,1.立即數(shù)尋址,在操作數(shù)前面需要加#字號來說明該操作數(shù)為立即數(shù)。否則會把該操作數(shù)誤認為是一個地址,從而把立即數(shù)尋址變成絕對地址尋址。,特點,指令中包含有執(zhí)行指令所需要的操作數(shù)。立即數(shù)分為3、5、8或9位的短立
3、即數(shù)和16位的長立即數(shù)兩種。短立即數(shù)可包含在單字或雙字指令中,長立即數(shù)在雙字指令中。,注意,LD #93h,A LD 93h,A,舉例,,2.絕對地址尋址,特點,在指令中包含有所要尋址的存儲單元的16位地址。這個16位的地址可以用其所在單元的地址標號或者16位符號常數(shù)來表示。,(1)數(shù)據(jù)存儲器地址(damd)尋址,用一個符號或一個數(shù)來確定數(shù)據(jù)空間的一個地址。,方法,MVKD SAMPLE,*AR3,舉例,用一個符號或一個具
4、體的數(shù)來確定程序存儲器中的一個地址,2.絕對地址尋址,(2)程序存儲器地址(pmad)尋址,方法,MVPD TABLE,*AR4,舉例,用一個符號或一個常數(shù)來確定外部I/O口地址,2.絕對地址尋址,(3)PA尋址 端口(PA),方法,PORTR FIFO,*AR5,舉例,,用一個符號或一個常數(shù)來確定數(shù)據(jù)存儲器中的一個地址,2.絕對地址尋址,(4)*(lk)尋址,方法,LD *(BUFFER),A,舉例,特點,允許所有使用Smem尋
5、址的指令去訪問數(shù)據(jù)空間的任意單元而不改變數(shù)據(jù)頁指針(DP)的值,也不用對ARx進行初始化,,用累加器中的數(shù)值作為地址來讀寫程序存儲器。,方法,READA Smem WRITA Smem,舉例,特點,可用來完成程序存儲器單元的數(shù)據(jù)與數(shù)據(jù)存儲器單元的數(shù)據(jù)進行交換,3.累加器尋址,可以在不改變DP或SP的情況下,隨機地尋址128個存儲單元中的任何一個單元。,用一個符號或一個常數(shù)來確定7位偏移值,與DP或SP共同形成16位的數(shù)據(jù)存儲器實際
6、地址。,4.直接尋址,方法,LD #x,DPLD @u,A ADD @v,A ===========SSBX CPL LD @X1,A ADD @Y2,A,舉例,特點,CPL=0 7位dma域與9bit的DP相結(jié)合 形成16位的數(shù)據(jù)存儲器地址。CPL=1 7位dma域加上(正偏移)SP 的值形成16位的數(shù)據(jù)存儲器地址。,DP值是從0~511(29-1),以DP為基準的直接尋址把存儲器分成51
7、2頁,7位的dma范圍從0~127,每頁有128個可訪問的單元。,,,5.間接尋址,方法,特點,(AR0~AR7)→ARAU0/ARAU1 →16位無符號算術(shù)運算→尋址范圍為64K,能在一個指令中訪問兩個數(shù)據(jù)存儲器單元,兩個獨立的存儲器單元讀數(shù)據(jù)讀一個、寫另一個存儲器單元讀寫兩個連續(xù)的存儲器單元,,5.間接尋址,(1)單操作數(shù)尋址,LD *AR1,B,單操作數(shù)間接尋址的硬件框圖,單數(shù)據(jù)存儲器操作數(shù)間接尋址類型,1) 循環(huán)尋址
8、 循環(huán)緩沖區(qū)的長度值存放在循環(huán)緩沖區(qū)長度寄存器BK中,BK中的數(shù)值由指令設(shè)定。長度為R的循環(huán)緩沖器必須從一個N位地址的邊界開始,即循環(huán)緩沖器基地址的最低N位必須為0。N是滿足2N>R的最小整數(shù)。R的值必須裝入BK。例如,含有31個字的循環(huán)緩沖器必須從最低5位為0的地址開始,即xxxx xxxx xxx0 00002,N=5,2N=25>R=31,且31必須裝入BK。如:STM #1k,BK如果R=32,則最小的N值為6,循環(huán)緩沖
9、區(qū)的起始地址必須有6個最低有效位為0,即×××× ×××× ××00 00002。,2) 位倒序?qū)ぶ?在這種尋址方式中,用AR0存放FFT點數(shù)的一半整數(shù)N,用另一輔助寄存器指向一數(shù)據(jù)存放的物理單元。當(dāng)使用位倒序?qū)ぶ钒袮R0加到輔助寄存器中時,地址以位倒序的方式產(chǎn)生,即進位是從左向右,而不是從右向左進位。 例如: 0110 10
10、00 + 0000 1000 0110 0100,以8位輔助寄存器為例,AR1表示了在存儲器中數(shù)據(jù)的基地址(0110 0000)2,AR0的值為(0000 1000)2。利用以下兩條語句可以向外設(shè)口(口地址為PA)輸出整序后的FFT變換結(jié)果:RPT #15 重復(fù)執(zhí)行下條指令15+1次PORTW *AR1+0B,PA 向外設(shè)口PA輸出整結(jié)果,位倒序?qū)FT變換結(jié)果的序號調(diào)整,0頁
11、尋址。不影響當(dāng)前DP或SP值 。用于直接尋址和間接尋址,用來修改存儲器映象寄存器,6.存儲器映象寄存器尋址,功能,LDM PRD,A,舉例,特點,方法,高9位數(shù)據(jù)存儲器地址被置0,利用指令中的低7位地址訪問MMR。,7.堆棧尋址,從高地址向低地址方向生長,SP)來管理堆棧,SP始終指向堆棧中所存放的最后一個數(shù)據(jù),即SP指針始終指向棧頂。在壓入操作時,先減小SP的值,再將數(shù)據(jù)壓入堆棧;在彈出操作時,先從堆棧彈出數(shù)據(jù),再增加SP的值。,用
12、來在中斷和子程序調(diào)用時自動保存程序計數(shù)器(PC)中的數(shù)值,也能用來保護現(xiàn)場或傳送參數(shù),功能,特點,PSHD *AR2 POPD *AR3,第二節(jié) 程序存儲器地址的生成,程序地址生成器(PAGEN)構(gòu)成,程序計數(shù)器(PC)重復(fù)計數(shù)器(RC)塊重復(fù)計數(shù)器(BRC)塊重復(fù)起始地址寄存器(RSA)塊重復(fù)結(jié)束地址寄存器(REA),核心,16位程序計數(shù)器(PC)內(nèi)中保存某個內(nèi)部或外部程序存儲器的地址。,,地址內(nèi)容為: 即將取指的某條指
13、令; 某個16位立即操作數(shù); 系數(shù)表。在程序存儲器中的地址,將程序存儲器地址加載到程序計數(shù)器的途徑,1.分支轉(zhuǎn)移操作,通過分支轉(zhuǎn)移指令改寫PC,可以改變程序的流向。而子程序調(diào)用指令則通過將一個返回地址壓入堆棧,執(zhí)行返回時恢復(fù)原地址。,可執(zhí)行:分支轉(zhuǎn)移循環(huán)控制子程序操作,功能,方法,條件分支轉(zhuǎn)移無條件分支轉(zhuǎn)移,B[D]用指令中所給出的地址加載PCBACC[D]用所指定的累加器的低16位作為地址加載PC。,帶延遲不帶延遲操
14、作,轉(zhuǎn)移種類,BC[D]如果指令中所規(guī)定的條件得到滿足,就用指令中所給出的地址加載PC;BANZ[D]如果當(dāng)前輔助寄存器不等于0,就用指令中所規(guī)定的地址加載PC。,BC new,AOV BANZ loop,*AR2-,B nextBACC A,2.調(diào)用和返回,轉(zhuǎn)移前,原程序的下條指令的地址被壓入堆棧,而在返回時則將這個地址彈出至PC,使被中斷了的原程序能繼續(xù)執(zhí)行。,當(dāng)采用調(diào)用指令進行子程序或函數(shù)調(diào)用時,DSP中斷當(dāng)前運行的程序,轉(zhuǎn)
15、移到程序存儲器的其它地址繼續(xù)運行。,功能,方法,無條件調(diào)用與返回有條件調(diào)用與返回,帶延遲不帶延遲,CALL[d] lopRET main,3.條件指令中的條件判斷,多重條件判斷,BC pmad,cond[,cond[,cond]],相與關(guān)系,相或關(guān)系,BC pmad,condBC pmad,cond,第1組,例如,可以從A類中選一個條件,同時可以從B類中選擇一個條件。但是不能從同一類中選擇兩個條件。另外,兩種條件測試的累
16、加器必須是同一個。,可以同時測試AGT和AOV,但不能同時測試AGT和BGT。,第2組,例如,可以在A、B、C三類中各選擇一個條件,但不能從同一類中選擇兩個條件,可以在A、B、C三類中各選擇一個條件,但不能從同一類中選擇兩個條件,特例,如果條件分支轉(zhuǎn)移出去的地方只有1~2字的程序段,則可以用一條單周期條件執(zhí)行指令(XC)來代替分支轉(zhuǎn)移指令:XC n,cond[,cond[,cond]]當(dāng)n=1,且條件得到滿足,就執(zhí)行緊隨此
17、 條件指令后的1個字指令。當(dāng)n=2,且條件得到滿足,就執(zhí)行緊隨此 指令后的1個雙字指令或者2條單 字指令?! ‘?dāng)條件不滿足,就依n的值執(zhí)行1 條或2條NOP指令。,特點2,特點1,4.單條指令的重復(fù)操作,重復(fù)執(zhí)行(RC)+1次。RC內(nèi)容不能編程設(shè)置,只能由重復(fù)指令(RPT和RPTZ)中的操作數(shù)加載。操作數(shù)n的最大值為65 535,最大重復(fù)執(zhí)行次數(shù)為65 535+1。,一旦重復(fù)指令被取指、譯碼,直到重復(fù)循
18、環(huán)完成以前,對所有的中斷(包括 ,但不包括 )均不響應(yīng)。,功能,重復(fù)執(zhí)行下一條指令,重復(fù)過程,當(dāng)RPT指令執(zhí)行時:①首先把循環(huán)的次數(shù)裝入循環(huán)計數(shù)器(RC),②其循環(huán)次數(shù)n由一個16位單數(shù)據(jù)存儲器操作數(shù) Smem或一個8位或16位常數(shù)k或lk給定。這樣, 緊接著的下一條指令會循環(huán)執(zhí)行n+1次。③循環(huán),RC在執(zhí)行減1操作時不能被訪問。注意:該循環(huán)內(nèi)不能套用循環(huán)。 當(dāng)RPTZ指令執(zhí)行時:對目的累加器dst清
19、0, 循環(huán)執(zhí)行下一條指令n+1次。,特點,5.塊重復(fù)操作,利用C54x內(nèi)部的塊重復(fù)計數(shù)器(BRC,加載值可為0~65 535)、塊重復(fù)起始地址寄存器(RSA)、塊重復(fù)結(jié)束地址寄存器(REA)與程序塊重復(fù)指令RPTB,可對緊隨RPTB、由若干條指令構(gòu)成的程序塊進行重復(fù)操作。,功能,將重復(fù)操作的范圍擴大到任意長度的循環(huán)回路,注意,1.RPT指令一旦執(zhí)行,不會停止操作,即使有中斷請求也不響應(yīng);2.RPTB指令可以響應(yīng)中斷;,例3-6
20、 對數(shù)據(jù)組x[5]中的每個元素加1?! ?bss x,5 ;為數(shù)組x分配5個存儲單元begin: LD #1,16,B ;將1左移16位放入B的 ;高端字的最低位 STM #4,BRC ; 4→BRC,(PC)+2 →RSA STM #x,AR4 ;將x的首地址賦給AR4 RPTB next-1??;將NEXT-1 →REA ADD *AR4,16,B,A ;x地址的內(nèi)
21、容左移16位加 ; B的高端字,結(jié)果放A STH A,*AR4+ ;將A的高端字存入x單元, ;完成加1操作next: LD #0,B ;對B清零 … ;必需next-1作為結(jié)束地址,,對寄存器的占用,6.循環(huán)的嵌套,執(zhí)行RPT指令時占用RPTC寄存器(重復(fù)計數(shù)器);執(zhí)行RPTB指令時要用到BRC、RSA和RSE寄存器。
22、只有一套塊重復(fù)寄存器,故塊重復(fù)操作不能嵌套。 由于RPT與RPTB兩者用了不同的寄存器,因此RPT指令可以嵌套在RPTB指令中,實現(xiàn)循環(huán)的嵌套。執(zhí)行BANZ指令只占用輔助寄存器ARx。不會與RPT RPTB指令相沖突。,嵌套原則,參與嵌套循環(huán)的寄存器不能重復(fù)使用,圖3-3 一個三重循環(huán)嵌套結(jié)構(gòu),第三節(jié) 流水線,流水線操作,在執(zhí)行多條指令時,將每條指令的預(yù)取指、取指、譯碼、尋址、讀取操作數(shù)、執(zhí)行等階段,相差一個階段地重疊地執(zhí)行。
23、,流水線操作的優(yōu)點,一條k段流水能在k+(n-1)個周期內(nèi)處理n條指令。其前k個周期用于完成第一條指令,其余n-1條指令的執(zhí)行需要n-1個周期。而非流水處理器上執(zhí)行n條指令則需要nk 個周期。當(dāng)指令條數(shù)n較大時,可認為每個周期內(nèi)執(zhí)行的最大指令個數(shù)為k。,預(yù)取指P取指F譯碼D尋址A讀取操作數(shù)R執(zhí)行X,流水線操作,在第一個機器周期用PC中的內(nèi)容加載PAB,在第二個機器周期用讀取到的指令字加載PB。,第三個周期用PB的內(nèi)容加載指令寄
24、存器IR,對IR內(nèi)的指令進行譯碼,產(chǎn)生執(zhí)行指令所需要的一系列控制信號。,預(yù)取指P取指F譯碼D尋址A讀取操作數(shù)R執(zhí)行X,流水線操作,用數(shù)據(jù)1讀地址加載DAB,或用數(shù)據(jù)2讀地址加載CAB,修正輔助寄存器和堆棧指針。,讀數(shù)據(jù)1加載DB,或讀數(shù)據(jù)2加載CB;用數(shù)據(jù)3寫地址加載到EAB,以便在流水線的最后一級將數(shù)據(jù)送到數(shù)據(jù)存儲空間。,執(zhí)行指令,或用寫數(shù)據(jù)加載EB。,空轉(zhuǎn)浪費周期,1.延遲分支轉(zhuǎn)移的流水線圖,無延遲流水線分支轉(zhuǎn)移的問題,地
25、址 指令a1,a2 B b1 這是一個四周期、二字分支指令a3 i3 這是任意的一周期、一字指令a4 i4 這是任意的一周期、一字指令... ...b1 j1,,例3-7,分支轉(zhuǎn)移指令流水線圖,用分支轉(zhuǎn)移指令的地址a1加載PAB。,取得雙字分支轉(zhuǎn)移指令,取得雙字分支轉(zhuǎn)移指令,分支轉(zhuǎn)移指令流水線圖,,i3和i4指令取指。由于這兩條指令處在
26、分支轉(zhuǎn)移指令的后面,雖然已經(jīng)取指,但不能進入譯碼級,且最終被丟棄。,分支轉(zhuǎn)移指令進入譯碼級,用新的值b1加載PAB,分支轉(zhuǎn)移指令流水線圖,j1指令取指,雙字分支轉(zhuǎn)移指令進入流水線的執(zhí)行級,執(zhí)行j1指令,雙字分支轉(zhuǎn)移指令進入流水線的執(zhí)行級,,由于i3和i4指令是不允許執(zhí)行的,所以這兩個周期均花在分支轉(zhuǎn)移指令的執(zhí)行上。,允許跟在延遲分支轉(zhuǎn)移指令之后的兩條單字或一條雙字指令可以被執(zhí)行,延遲分支轉(zhuǎn)移,,注意,1.延遲操作指令后面只有兩個字的空
27、 隙,因此不能在此空隙中安排任何 一類分支轉(zhuǎn)移指令或重復(fù)指令;2.在CALLD或RETD的空隙中還不能安 排PUSH和POP指令。3.延遲操作指令比它們的非延遲型 指令要快,在調(diào)試延遲型指令時, 直觀性稍差一些,因此希望在大多 數(shù)情況下還是采用非延遲型指令。,例3-8 在完成R=(x+y)*z操作后轉(zhuǎn)至next?! 】梢苑謩e編出如下兩段程序:利用普通分支轉(zhuǎn)移指令B 利用延遲分支轉(zhuǎn)移指令BD LD
28、 @x,A LD @x,A ADD @y,A ADD @y,A STL A, @s STL A, @s LD @s,T LD @s,T MPY @z,A BD next STL A, @r MPY @z,A B next
29、 STL A, @r(共8個字,10個T) (共8個字,8個T),,在空閑的隨后兩周期中執(zhí)行下兩條指令,XC n,cnd[,cnd[,cnd] 如果條件滿足,則執(zhí)行下面n(n=1或2)條指令,否則下面n條指令改為執(zhí)行n條NOP指令。,2.條件執(zhí)行指令的流水線圖,條件執(zhí)行指令XC,有下列程序:地址 指令a1 i1a2 i2a3 i3
30、a4 XC 2, conda5 i5a6 i6,,,條件執(zhí)行指令流水線圖,XC指令的地址a4加載到PAB,取XC指令的操作碼,求解XC指令所規(guī)定的條件。如果條件滿足,則后面指令i5和i6進入譯碼級并執(zhí)行;否則不對i5和i6指令譯碼。,1. XC是一條單字單周期指令,與條件跳 轉(zhuǎn)指令相比,具有快速選擇其后1或2 條指令是否執(zhí)行的優(yōu)點 ;2. XC指令在執(zhí)行前2個周期就已經(jīng)求出
31、 條件,如果在這之后到執(zhí)行前改變條 件(如發(fā)生中斷),將會造成無期望 的結(jié)果 。3. 要盡力避免在XC指令執(zhí)行前2個周期 改變所規(guī)定的條件 。 4. 并沒有規(guī)定XC指令后的一條或兩條指 令必須是單周期指令。,注意,CPU在單個周期內(nèi)兩次訪問雙尋址存儲器,3.雙尋址存儲器的流水線沖突,流水線沖突原因,,不會產(chǎn)生流水線沖突的情況,(1)在單周期內(nèi)允許同時訪問DARAM的不同塊。(2)當(dāng)流水線中的一條
32、指令訪問某一存儲器塊時, 允許流水線中處于同一級的另一條指令訪問 另一個存儲器塊。(3)允許處于流水線不同級上的兩條指令同時訪 問同一個存儲器塊。,是利用一次訪問中對前、后半個周期分時進行訪問的緣故。,CPU能夠在單周期內(nèi)對DARAM進行兩次訪問而不沖突,,對PAB/PB取指 利用前半周期對DAB/DB讀取第一個數(shù)據(jù) 利用前半周期對CAB/CB讀取第二個數(shù)據(jù)
33、 利用后半周期對EAB/EB將數(shù)據(jù)寫存儲器 利用后半周期,(1) 同時從同一存儲器塊中取指和取操作數(shù)(都在前半個周期);2.同時對同一存儲器塊進行寫操作和讀(第二個數(shù))操作(都在后半周期)。,解決沖突辦法,人為合理安排指令,錯開訪問時序,CPU通過寫操作延遲一個周期,或者通過插入一個空周期的辦法,自動地解決,CPU同時訪問DARAM的同一存儲器塊就會發(fā)生時序上的沖突。,從DARAM塊中同時取指和取操作數(shù),,,沖突,
34、延遲一個周期,,4.解決流水線沖突的方法,(1)可能發(fā)生流水線沖突的情況,1) 輔助寄存器(AR0~AR7)。2) 重復(fù)塊長度寄存器(BK)。3) 堆棧指針。4) 暫存器(T)。5) 處理器工作方式狀態(tài)寄存器(PMST)。6) 狀態(tài)寄存器(ST0和ST1)。7)塊重復(fù)計數(shù)器(BRC)。8)存儲器映象累加器(AG、AH、AL、BG、BH、BL)。,流水線沖突情況分析,發(fā)生流水線沖突的例子,在流水線的執(zhí)行階段進行寫操作,在流水
35、線的尋址階段生成地址,沖突,,無等待周期問題,解決,數(shù)據(jù)未準備好,,發(fā)生流水線沖突的例子,在流水線的執(zhí)行階段進行寫操作,讀數(shù)階段將常數(shù)10寫到AR1,沖突,同時利用E總線,CPU自動地將STM的寫操作延遲一個周期,在流水線的尋址階段生成地址,新沖突,數(shù)據(jù)未準備好,解決,發(fā)生流水線沖突的例子,STLM指令后面插入一條NOP指令,在流水線的執(zhí)行階段進行寫操作,讀數(shù)階段將常數(shù)10寫到AR1,在流水線的尋址階段生成地址,,E總線錯開,解決,,數(shù)
36、據(jù)準備好,解決,4.解決流水線沖突的方法,(2)用等待周期表解決流水線沖突,等待周期表給出了對存儲器映象寄存器以及ST0、ST1、PMST的控制字段進行寫操作的各種指令所需插入的等待周期。對雙字或三字指令,都會提供隱含的保護周期。利用這些指令提供的隱含的保護周期,有時可以不插NOP指令。,等待周期表1,例3-11 利用表3-8等待周期表1選擇插入的NOP數(shù)。SSBX SXMNOPLD @x,B 由于LD @ x,
37、B是一條單字指令,不提供隱含的保護周期。根據(jù)表3-8的等待周期表1,應(yīng)當(dāng)在SSBX SXM 指令后插入一條NOP指令。而SSBX SXMLD *(x),B由于LD *(x),B是一條雙字的絕對尋址指令,它隱含一個等待周期,故SSBX指令就不要再插NOP指令了。,ST1第8位SXM=0禁止符號位擴展SXM=1允許符號位擴展,例3-12 利用隱含等待周期解決流水線沖突。LD @GAIN ,TSTM #inp
38、ut,AR1MPY *AR1+,A例3-13利用表3-8等待周期表3插入NOP周期解決流水線沖突。STLM B,AR2NOPSTM #input,AR3MPY AR2+,*AR3+,A,LD 中寫T和STM中寫AR1要用到E總線,由于STM是一條雙字指令,隱含一個等待周期,故對于AR1來說,等待周期為0。,STM中寫AR3要用到E總線,會與STLM中寫AR2用E總線相沖突,查表3-8等待周期表3的控制字段為A
39、R3,STLM指令后應(yīng)插入2個NOP,但由于下條指令STM隱含1個等待周期,故只需要插入一條NOP指令。,第四節(jié) 指令系統(tǒng)概述,TMS320C54x是TMS320系列中的一種定點數(shù)字信號處理器,它的指令系統(tǒng)分助記符形式和代數(shù)式形式兩種。共有指令129條,由于操作數(shù)的尋址方式不同,派生至205條。,1.可同時讀入2或3個操作數(shù);2.支持雙精度運算的32位長操作數(shù)指令;3.可進行單條指令重復(fù)和塊指令重復(fù)操作;4.有塊存儲器傳送指令
40、和并行操作(如并行存儲和加載、并行存儲和加/減法、并行存儲和乘法、并行加載和乘法)指令;5.設(shè)有條件存儲指令及延遲操作指令、有從中斷快速返回指令;6.有為特殊用途設(shè)計的指令(如支持FIR濾波、最小均方算法LSM、多項式計算以及浮點運算);7.有為省電安排的空轉(zhuǎn)指令。,TMS320C54x指令系統(tǒng)的主要特點,TMS320C54x的指令集有近兩百條指令,按功能分為如下幾類: ?算術(shù)運算指令?邏輯運算指令?程
41、序控制指令?裝入和存儲指令,一、算術(shù)運算指令,算術(shù)運算指令可分為如下幾類: ? 加法指令 ? 減法指令 ? 乘法指令 ? 乘加指令 ? 乘減指令? 雙數(shù)/雙精度指令 ? 特殊操作指令,,1、加法指令,定點DSP中數(shù)據(jù)表示方法,當(dāng)它表示一個整數(shù)時,其最低位(D0)表示1,D1位表示2的1次方,次高位(D14)表示2的14方。如果表示一個有符號數(shù)時,最高位(D1
42、5)為符號位,0表示正數(shù),1表示負數(shù)。例如,07FFFH表示最大的正數(shù)32767(十進制),而0FFFFH表示最大的負數(shù)-1(負數(shù)用2的補碼方式顯示)。當(dāng)需要表示小數(shù)時,小數(shù)點的位置始終在最高為后,而最高位(D15)表示符號位。這樣次高位(D14)表示0.5,然后是0.25,最低位(D0)表示。所以4000H表示小數(shù)0.5,2000H表示小數(shù)0.25,而0001H表示16位定點DSP表示的最小的小數(shù)(有符號)0.00003051757
43、8125。,實現(xiàn)16位定點加法,‘C54X中提供了多條用于加法的指令,如ADD,ADDC,ADDM和ADDS。其中ADDS用于無符號數(shù)的加法運算,ADDC用于帶進位的加法運算(如32位擴展精度加法),而ADDM專用于立即數(shù)的加法。,使用ADD完成加法,ld temp1,a;將變量temp1裝入寄存器A add temp2,a;將變量temp2與寄存器A相加
44、 ;結(jié)果放入A中 stla,temp3;將結(jié)果(低16位)存入變量 ;temp3中。 注意,這里完成計算temp3=temp1+temp2,我們沒有特意考慮temp1和temp2是整數(shù)還是小數(shù),在加法和下面的減法中整數(shù)運算和定點的小數(shù)運算都是一樣的。,ADD中尋址方式,ADD Smem [,SHIFT],src [,dst
45、] 例如: ADD *AR0,1,A,A ADD 60H,-1,A,A ADD *AR5,1,A,B ADD Xmem, SHFT, src 例如: ADD *AR5,1,AADD Xmem,Ymem, dst 例如: ADD *AR2,*AR3,A,2、減法指令,
46、實現(xiàn)16位定點減法,‘C54X中提供了多條用于減法的指令,如SUB,SUBB,SUBC和SUBS。其中SUBS用于無符號數(shù)的減法運算,SUBB用于帶進位的減法運算(如32位擴展精度的減法),而SUBC為移位減,DSP中的除法就是用該指令來實現(xiàn)的。,減法指令使用舉例,stm temp1,ar3;將變量temp1的地址裝入ar3寄存器 stm temp3,ar2;將變量temp3的地址裝入ar2寄存器 sub*ar2+, *a
47、r3,b;相減,結(jié)果放入寄存器B(高16位)中, ; 同時ar2加1。 sthb,63h;將相減的結(jié)果(高16位)存入變量63h,利用SUBC實現(xiàn)除法,在‘C54X中沒有提供專門的除法指令,一般有兩種方法來完成除法。一種是用乘法來代替,除以某個數(shù)相當(dāng)于乘以其倒數(shù),所以先求出其倒數(shù),然后相乘。這種方法對于除以常數(shù)特別適用。另一種方法是使用SUBC指令,
48、重復(fù)16次減法完成除法運算。,利用SUBC完成除法運算,ldtemp1,B;將被除數(shù)temp1裝入B寄存 ;器的低16位rpt#15 ;重復(fù)SUBC指令16次subctemp2,b;使用SUBC指令完成除法stlB,temp3;將商(B寄存器的低16位)
49、 ;存入變量temp3sthB,temp4;將余數(shù)(B寄存器的高16位) ;存入變量temp4 注: 實際上是完成整數(shù)除法,實現(xiàn)小數(shù)除法,在‘C54X中實現(xiàn)16位
50、的小數(shù)除法與前面的整數(shù)除法基本一致,也是使用SUBC指令來完成。但有兩點需要注意:第一,小數(shù)除法的結(jié)果一定是小數(shù)(小于1),所以被除數(shù)一定小于除數(shù)。在執(zhí)行SUBC指令前,應(yīng)將被除數(shù)裝入A或B寄存器的高16位,而不是低16位。其結(jié)果的格式與整數(shù)除法一樣。第二,應(yīng)考慮符號位對結(jié)果小數(shù)點的影響。所以應(yīng)對商右移一位,得到正確的有符號數(shù)。,3、乘法指令,實現(xiàn)16定點整數(shù)乘法,在‘C54X中提供了大量的乘法運算指令,其結(jié)果都是32位,放在A或B寄存
51、器中。乘數(shù)在‘C54X的乘法指令很靈活,可以是T寄存器、立即數(shù)、存貯單元和A或B寄存器的高16位。如果是無符號數(shù)乘時,請使用MPYU指令。這是一條專用于無符號數(shù)乘法運算的指令,而其它指令都是有符號數(shù)的乘法。,整數(shù)乘法舉例,rsbxFRCT;清FRCT標志,準備整數(shù)乘ldtemp1,T;將變量temp1裝入T寄存器mpytemp2,a;完成temp2*temp1,結(jié)果放
52、 ;入A寄存器(32位),實現(xiàn)小數(shù)乘法,在‘C54X中,小數(shù)的乘法與整數(shù)乘法基本一致,只是由于兩個有符號的小數(shù)相乘,其結(jié)果的小數(shù)點的位置在次高的后面,所以必須左移一位,才能得到正確的結(jié)果。‘C54X中提供了一個狀態(tài)位FRCT,將其設(shè)置為1時,系統(tǒng)自動將乘積結(jié)果左移移位。兩個小數(shù)(16位)相乘后結(jié)果為32位,如果精度允許的話,可以只存高16位,將低16位丟棄,這樣仍可得到16位的結(jié)果。,小數(shù)乘法舉例,ssbx
53、FRCT ;FRCT=1,準備小數(shù)乘法 ld temp1,16,a ;將變量temp1裝入寄存器A的高16位 mpya temp2 ;完成temp2乘寄存器A的高16位,結(jié) ;果在B中,同時將temp2裝入T寄存器 sth b,temp3 ;將乘積結(jié)果的高16位存入變量temp3如:0.1
54、(0x0ccd) x 0.7(0x599a) = 0.06997680664063(0x08f5)注:可以使用MPYR完成四舍五入。 比較如下結(jié)果 mpyr temp1,b ; T * temp1 -> b,4、乘加和乘減指令,5、雙精度/雙數(shù)操作指令,6、特殊指令,二、邏輯運算指令,邏輯指令包括與、或、異或、移位和測試指令1、與指令(AND),2、或、異或指令,3、移位和測試指令,,三、程序控
55、制指令,程序控制指令包括:分支指令調(diào)用指令中斷指令返回指令重復(fù)指令堆棧操作指令混合程序控制指令,1、分支指令,2、調(diào)用與中斷指令,3、返回指令,4、重復(fù)指令和堆棧操作指令,5、混合程序控制指令,四、裝入和存儲指令,裝入和存儲指令包括:一般的裝入和存儲指令條件存儲指令并行裝入和存儲指令并行裝入和乘法指令并行存儲和加件乘指令混合裝入和存儲指令,1、一般的裝入指令
56、,2、存貯指令,3 并行裝入和存儲指令,4、條件存儲指令,5、并行存儲和加、減、乘法指令,6、并行裝入和乘法指令,7、混合裝入和存儲指令,注意:同一條指令在不同存儲器中可能有不同執(zhí)行時間,操作數(shù)在雙尋址空間、單尋址空間和外部程序代碼在雙尋址、單尋址和外部空間操作數(shù)和代碼在相同存儲器塊中數(shù)據(jù)空間插入了等待周期程序空間插入了等待周期,FIRS指令使用方法:FIRS *AR2+, *AR3+, COEF,,特殊指令使用說
57、明,FIRS指令 FIRS指令用于線性相位濾波器的處理。一個如下圖的8階線性相位濾波器的輸出表達式:,FIR濾波的兩指令MAC、FIRS,RPTZ A,#(N-1) ;重復(fù)MAC指令N次,先將A清零MAC *FIR_DATA_P+0%,*FIR_COFF_P+0%,A
58、 ; 完成濾波計算。注意FIR濾波 ;系數(shù)存放在數(shù)據(jù)存儲區(qū),RPTZ B, #(N/2-1) ; 重復(fù)FIRS指令N/2次,先將B清零 FIRS *ar2+0%, *ar3+0%,filter_coff+N/2 ;完成濾波計算。注意FIR濾波系數(shù) ;存放在程序存貯filter_coff為 ;系數(shù)起始地址,,Viter
59、bi譯碼指令DADST、DSADT、CMPS,在信道均衡和解碼中經(jīng)常會使用到Viterbi算法,C54x為此提供了專門的硬件和指令。根據(jù)輸入信號確定分支似然概率增加量D1/D2,放在T寄存器中,TRN存儲可能信號譯碼輸出。,相關(guān)指令應(yīng)用,,最小均方運算LMS,在進行自適應(yīng)濾波等操作中經(jīng)常會使用LMS算法,C54x提供的LMS指令方便了編程。如下圖所示的自適應(yīng)濾波器設(shè)計中,濾波器系數(shù)修正公式為:,其中,e(i) = d(i) - y(i)
60、。濾波器輸出:,基于LMS的自適應(yīng)濾波編程,,數(shù)據(jù)歸一化相關(guān)指令EXP、NORM,歸一化一個數(shù)是先求其指數(shù),然后把它調(diào)整到最大精度格式。實現(xiàn)方法如下:,,,數(shù)據(jù)塊移動MVDD、MVDP、MVPD,在C54x系列DSP,數(shù)據(jù)與數(shù)據(jù)存儲器、數(shù)據(jù)與程序存儲器之間可以方便的進行數(shù)據(jù)傳輸,結(jié)合單指令循環(huán)可實現(xiàn)數(shù)據(jù)塊移動。如16個系數(shù)的移動:,,指令效率的提高,C54x中有一些指令功能差不多,但編寫出的程序效率不同,應(yīng)靈活使用,如:MPY[
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第三章 指令系統(tǒng)
- 第三章 指令系統(tǒng)部分練習(xí)
- 第三章 8086指令系統(tǒng)
- 第三章_pic單片機指令系統(tǒng)
- 第三章mcs-51指令系統(tǒng)
- 第三章mcs-51單片機的指令系統(tǒng)
- 第三章 80x86尋址方式與指令系統(tǒng)
- 第三章s7-300400的編程語言與指令系統(tǒng)
- 第三章 sdh技術(shù)及其結(jié)構(gòu)特點
- 第三章、傳感器及成像特點(2013)
- 化學(xué)反應(yīng)原理第三章-第三章復(fù)習(xí)
- 第三章存儲系統(tǒng)
- 第三章 證明
- internet第三章
- 第三章投標
- 第三章 句子
- 第三章課件
- 第三章復(fù)習(xí)
- 第三章-匯款
- 第三章.doc
評論
0/150
提交評論