8051、ARM和DSP指令周期的測試與分析方法
3 TMS320F2812工作機制及指令周期測試
TMS320F2812是TI公司的一款用于控制的高性能和高性價比的32位定點DSP芯片。該芯片最高可在150 MHz主頻下工作(本文將其設(shè)置到100 MHz),并帶有18K×16位0等待周期片上SRAM和128K×16位片上Flash(存取時間為36 ns)。TMS320F2812采用哈佛總線結(jié)構(gòu),即在同一個時鐘周期內(nèi)可同時進行一次取指令、讀數(shù)據(jù)和寫數(shù)據(jù)的操作,同時TMS320F2812還通過采用8級流水線來提高系統(tǒng)指令的執(zhí)行速度。
為了觀察指令周期,對TMS320F2812的GPIOA0進行循環(huán)的置位操作和清除操作。C源程序如下:
#include DSP28_Device.h
void main(void) {
InitSysCtrl();/*初始化系統(tǒng)*/
DINT;/*關(guān)中斷*/
IER = 0x0000;
IFR = 0x0000;
InitPieCtrl();/*初始化PIE控制寄存器*/
InitPieVectTable();/*初始化PIE矢量表*/
InitGpio();/*初始化EV*/
EINT;
ERTM;
for(;;) {
GpioDataRegs.GPADAT.all=0xFFFF;
GpioDataRegs.GPADAT.all=0xFFFF;
GpioDataRegs.GPADAT.all=0xFFFF;
GpioDataRegs.GPADAT.all=0x0000;
GpioDataRegs.GPADAT.all=0x0000;
GpioDataRegs.GPADAT.all=0x0000;
}
}
圖4 GPIO的P0.25腳輸出波形3
其中最重要的是要對通用輸入/輸出進行初始化和確定系統(tǒng)CPU時鐘。其中系統(tǒng)的時鐘通過PLL設(shè)定為100 MHz,而初始化 InitGpio() 的源程序為:
#include DSP28_Device.h
void InitGpio(void)
{ EALLOW;
//多路復(fù)用器選為數(shù)字I/O
GpioMuxRegs.GPAMUX.all=0x0000;
//GPIOAO為輸出,其余為輸入
GpioMuxRegs.GPADIR.all=0x0001;
GpioMuxRegs.GPAQUAL.all=0x0000;
EDIS;
}
通過在主程序for(;;)的地方加斷點,可以很容易找到上面主程序中循環(huán)部分程序編譯后的匯編指令:
3F8011 L1:
3F8011761FMOVWDP,#0x01C3
3F8013 2820 MOV@32,#0xFFFF
3F8015 2820 MOV@32,#0xFFFF
3F8017 2820 MOV@32,#0xFFFF
3F8019 2820 MOV@32,#0xFFFF
3F801B 2820 MOV@32,#0xFFFF
3F801D 2820 MOV@32,#0xFFFF
3F801F 2B20 MOV@32,#0
3F8020 2B20 MOV@32,#0
3F8021 2B20 MOV@32,#0
3F8022 6FEF SBL1,UNC
其中第1列為程序在RAM中的位置,第2列為機器碼,后面就是匯編語言程序。指令“MOV @32,#0xFFFF”使GPIO輸出高電平,指令“MOV @32,#0”使GPIO輸出低電平。其中含有6個使GPIOA0輸出高電平的指令和3個使GPIOA0輸出低電平的指令,系統(tǒng)的指令周期為10 ns,因此循環(huán)周期中保持高電平的時間為60 ns。通過將該程序放在H0 SARAM中進行調(diào)試,可得GPIOA0的波形,如圖5所示。其中高電平時間正好為60 ns。注意,由于3個低電平之后要進行跳轉(zhuǎn),故清空流水線的周期要長一些。
圖5 TMS320F2812中GPIOA0的波形1
為了觀察乘法指令的周期,將上述循環(huán)部分的C源程序修改為:
for(;;)
{Uint16 test1,test2,test3;
test1=0x1234; test2=0x2345;
GpioDataRegs.GPADAT.all=0xFFFF;
GpioDataRegs.GPADAT.all=0xFFFF;
GpioDataRegs.GPADAT.all=0xFFFF;
test3=test1*test2;
GpioDataRegs.GPADAT.all=0x0000;
GpioDataRegs.GPADAT.all=0x0000;
GpioDataRegs.GPADAT.all=0x0000;
}
上述程序經(jīng)過編譯、鏈接后的匯編指令如下:
3F8012L1:
3F80122841MOV*-SP[1],#0x1234
3F8014 2842 MOV*-SP[2],#0x2345
3F8016 761F MOVWDP,#0x01C3
3F8018 2820 MOV@32,#0xFFFF
3F801A 2820 MOV@32,#0xFFFF
3F801C 2820 MOV@32,#0xFFFF
3F801E 2D42 MOVT,*-SP[2]
3F801F 1241 MPYACC,T,*-SP[1]
3F8020 9643 MOV*-SP[3],AL
3F8021 2B20 MOV@32,#0
3F8022 2B20 MOV@32,#0
3F8023 2B20 MOV@32,#0
3F8024 6FEE SBL1,UNC
其中使GPIOA0為高電平的指令仍然為6個指令周期(其中包括1個乘法指令),因為乘法指令也是單周期的,因此循環(huán)周期中保持高電平的時間為60 ns。通過將該程序放在H0 SARAM中進行調(diào)試可得GPIOA0的波形,如圖6所示。其中高電平時間正好為60 ns,而由于3個低電平之后要進行跳轉(zhuǎn),要清空流水線,而且還要為乘法做準備,因此保持低電平的時間比圖5所需的時間要長。當采用數(shù)字式示波器觀察時,如果探頭采用×1檔觀察的波形不是很理想,則可以采用×10檔,并配合調(diào)節(jié)探頭的補償旋鈕。
圖6 TMS320F2812中GPIOA0的波形2
4、 三種微處理器的比較
首先要強調(diào)的是,這幾種微控制器都可以通過提高晶振的振蕩頻率來縮短指令周期,但是這些控制器的振蕩頻率是有一定限制的,例如單片機不超過40 MHz,而LPC2114的頻率不超過60 MHz,TMS320F2812的最高頻率為150 MHz。在同樣的工作頻率下,ARM指令運行的指令周期遠遠高于傳統(tǒng)的單片機。因為傳統(tǒng)的單片機沒有采用流水線機制,而ARM核和DSP都采用了流水線,但是由于訪問外設(shè)和RAM等存儲器要加一定的時鐘周期,因此ARM不是真正可以實現(xiàn)單周期運行的,特別是不能實現(xiàn)單周期的乘法指令,而DSP可以實現(xiàn)真正的單周期乘法指令,速度要遠遠高于ARM微控制器。
評論