基于ARM的高效C語(yǔ)言編程
引言
本文引用地址:http://m.butianyuan.cn/article/151466.htmARM處理器以其高性能、低功耗、低成本等優(yōu)勢(shì)被廣泛應(yīng)用于各種成功的32位嵌入式系統(tǒng)中。提高執(zhí)行速度和減小代碼尺寸是嵌入式軟件設(shè)計(jì)的關(guān)鍵需求。盡管大多數(shù)的ARM編譯器和調(diào)試器都帶有性能優(yōu)化工具,但是為了保證其正確性,編譯器必須是穩(wěn)妥和安全的,而且它還受到處理器自身結(jié)構(gòu)的限制。因此,編程人員必須在理解編譯器工作特點(diǎn)的基礎(chǔ)上來(lái)實(shí)現(xiàn)代碼優(yōu)化。代碼的優(yōu)化方法較多,本文針對(duì)函數(shù)優(yōu)化方法進(jìn)行闡述。
1 函數(shù)局部變量的數(shù)據(jù)類(lèi)型
局部變量包括函數(shù)內(nèi)局部變量、函數(shù)參數(shù)、函數(shù)返回值。由于ARM數(shù)據(jù)操作都是32位,即使數(shù)據(jù)本身只需要8位或16位,對(duì)于這三類(lèi)局部變量也應(yīng)盡可能使用32位的數(shù)據(jù)類(lèi)型int或lONg,以提高代碼執(zhí)行效率。下面以簡(jiǎn)單求和函數(shù)為例進(jìn)行分析。
函數(shù)add1計(jì)算包含10個(gè)字的數(shù)組array的累加和,add2與add1功能相同,只是將函數(shù)add1的參數(shù)array類(lèi)型改為16位的short,函數(shù)內(nèi)局部變量i類(lèi)型改為8位的char,sum改為16位的short。add1、add2的C源代碼如下:
int add1(int *array){
unsigned int i;
int sum=0;
for(i=0;i10;i++)
sum=sum+array[i];
return sum;
}
short add2(short *array){
char i;
short sum=0;
for(i=0;i10;i++)
sum= sum+array[i];
return sum;
}
add1經(jīng)編譯產(chǎn)生的匯編代碼:
add1
mov r2,r0
mov r0,#0
mov r1,#0
add1_loop
ldr r3,[r2,r1,lsl #2]
add r1,r1,#1
cmp r1,#0x0a
add r0,r3,r0
bcc add1_loop
mov pc,r14
add2經(jīng)編譯產(chǎn)生的匯編代碼:
add2
mov r2,r0
mov r0,#0
mov r1,#0
add2_loop
評(píng)論