STM32L476 FPU 執(zhí)行效率之比較淺析
本應(yīng)用筆記基于STM32L4">STM32L476平臺(tái),通過實(shí)際測量來評(píng)定使能FPU">FPU時(shí)浮點(diǎn)運(yùn)算效率的情況。
2.測試工具
STM32L476 Nucleo,示波器
3.測試方法
MCU 運(yùn)行頻率設(shè)置為16MHz,根據(jù)下面公式1 做N次浮點(diǎn)運(yùn)算,分使能FPU和禁止FPU兩種情況,測試完成相同運(yùn)算所需要的時(shí)間。在例程中通過翻轉(zhuǎn)IO PB13 來標(biāo)定完成運(yùn)算所需要的時(shí)間。
3.1 測試代碼
根據(jù)公式1,分別定義A、B、C 三個(gè)常量,如下:
/* Private constants---------------------------------------------------------*/
#define A_CONSTANT(0.285f)
#define B_CONSTANT(0.443f)
#define C_CONSTANT(0.698f)
根據(jù)公式做對(duì)應(yīng)的運(yùn)算并通過GPIOC Pin0 輸出,測定對(duì)應(yīng)消耗時(shí)間:
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_SET);
temp = A_CONSTANT*x*x +B_CONSTANT*x + C_CONSTANT;
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_RESET);
3.2 代碼分析
根據(jù)測試用的一元二次方程,經(jīng)過IAR 編譯后,匯編結(jié)果如下:
3.2.1 FPU 使能
從匯編代碼可以看出,使能FPU 的情況下,完成一元二次方程的運(yùn)算只需要7 條單周期指令,總共耗時(shí)為7 個(gè)Clock 周期。通過IAR 的方針模式運(yùn)行,需要的CPU cycles 為7.
3.2.2 FPU 禁止
從匯編代碼可以看出,未使能FPU 的情況下,完成該一元二次方程的運(yùn)算需要執(zhí)行14 條指令,其中包括3 條兩周期指令,6 條單周期指令,5 條程序跳轉(zhuǎn)指令。通過IAR 的方針模式運(yùn)行,需要的CPU cycles 為207.
4.測試數(shù)據(jù)及結(jié)論
IO完成兩次翻轉(zhuǎn)耗時(shí)6.48 uS;
使能FPU 時(shí),除去IO 翻轉(zhuǎn)耗時(shí),完成一次運(yùn)算時(shí)間為6.52 uS(13 uS -6.48 uS),
如下圖示:
禁止FPU 時(shí),除去IO 翻轉(zhuǎn)耗時(shí),完成一次運(yùn)算時(shí)間為87.4 uS(93.88 uS -6.48 uS),如下圖示:
小結(jié)下,根據(jù)上面相關(guān)測試數(shù)據(jù)大致可得出如下結(jié)論:
• 完成同樣的一元二次方程運(yùn)算,禁止FPU時(shí)所消耗的時(shí)間約為使能FPU時(shí)消耗時(shí)間的13.4 倍左右。
評(píng)論