新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 高效的C編程之:除法運(yùn)算

高效的C編程之:除法運(yùn)算

作者: 時間:2013-09-30 來源:網(wǎng)絡(luò) 收藏

本文引用地址:http://m.butianyuan.cn/article/257023.htm

14.2

因?yàn)?a class="contentlabel" href="http://m.butianyuan.cn/news/listbylabel/label/ARM">ARM體系結(jié)構(gòu)本身并不包含硬件,所以在上實(shí)現(xiàn)除法是十分耗時的。指令集中沒有直接提供除法匯編指令,當(dāng)代碼中出現(xiàn)時,ARM編譯器會調(diào)用C庫函數(shù)(有符合除法調(diào)用,無符合除法調(diào)用_rt_udiv),來實(shí)現(xiàn)除法操作。根據(jù)除數(shù)和被除數(shù)的不同,32bit的除法運(yùn)算一般要占有20-140個指令周期。除法運(yùn)算占用的指令周期,由下面公式計(jì)算。

Time(除數(shù)n/被除數(shù)d)

=C0+C1*log2(除數(shù)n/被除數(shù)d)=

=C0+C1*(log2(除數(shù))-log2(被除數(shù))).

為了避免在程序中出現(xiàn)除法操作,編程時盡量使用其他運(yùn)算來代替除法操作。如,使用x>(z×y)來代替(x/y)>z。

另外,在無法避免的除法運(yùn)算中,盡量使用無符合除法代替有符號除法。這是因?yàn)樵贏RM庫函數(shù)中,無符合除法的運(yùn)算速度要快于有符合除法。

下面章節(jié)將詳細(xì)討論如何在代碼中提高除法運(yùn)算的執(zhí)行效率。

14.2.1

ARM的除法運(yùn)算庫函數(shù)能同時返回運(yùn)算的商和余數(shù)。

在一些同時需要商和余數(shù)的情況下,編譯器將調(diào)用一次除法運(yùn)算函數(shù)同時存儲運(yùn)算的商和余數(shù)。

下面是一個編譯器調(diào)用除法庫,同時存儲運(yùn)算的商和余數(shù)的例子。

源程序如下。

intcombined_div_mod(inta,intb)

{

return(a/b)+(a%b);

}

下面是編譯器編譯出的匯編代碼。

combined_div_mod

STMDBsp!,{lr}

MOVa3,a2

MOVa2,a1

MOVa1,a3

BL_

ADDa1,a1,a2

LDMIAsp!,{pc}

從上面的例子可以看出,調(diào)用一次除法運(yùn)算,同時返回了商和余數(shù)。

14.2.2使用2的整數(shù)次冪做除數(shù)

當(dāng)2的整數(shù)次冪做除數(shù)時,編譯器會自動將除法運(yùn)算轉(zhuǎn)換成移位運(yùn)算。所以在編寫程序算法時,盡量使用2的整數(shù)次冪做除數(shù)。

下面的例子顯示了編譯器對除法運(yùn)算的自動優(yōu)化。

源程序如下。

typedefunsignedintuint;

uintdiv16u(uinta)

{returna/16;

}

intdiv16s(inta)

{returna/16;

}

編譯器的編譯結(jié)果如下。

div16u

MOVa1,a1,LSR#4

MOVpc,lr

div16s

CMPa1,#0

ADDLTa1,a1,#f

MOVa1,a1,ASR#4

MOVpc,lr

從上面的例子可以看出,無符號除法的運(yùn)算速度快于有符號除法。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉