STM32 F7如何滿足嵌入式系統(tǒng)更高處理性能需求
意法半導(dǎo)體(ST)日前宣布推出業(yè)界首款基于ARM最新Cortex-M7內(nèi)核的STM32 F7系列微控制器,其性能遠(yuǎn)超ST之前的32位STM32F4微控制器,通過無(wú)縫升級(jí)路徑可將處理性能和DSP性能提高一倍。
本文引用地址:http://m.butianyuan.cn/article/201612/326949.htm“作為STM32微控制器產(chǎn)品家族的高端產(chǎn)品,STM32 F7使內(nèi)存和外存的性能達(dá)到一個(gè)新的水平,給開發(fā)人員帶來新的創(chuàng)新機(jī)會(huì),保證他們不需要再根據(jù)存儲(chǔ)器性能調(diào)整代碼?!盨T微控制器市場(chǎng)總監(jiān)Daniel Colonna表示,“而之所以能夠在業(yè)內(nèi)率先推出基于Cortex-M7的產(chǎn)品,首先得益于ST與ARM密切的合作關(guān)系。其次,ST也與第三方客戶保持著廣泛的合作,確保他們能夠及時(shí)得到ARM最新的技術(shù)支持并推出新產(chǎn)品。強(qiáng)大的開發(fā)生態(tài)系統(tǒng)結(jié)合多元化的微控制器、傳感器、功率器件和通信產(chǎn)品組合,以及貼心的客戶技術(shù)支持服務(wù),ST一直在延續(xù)STM32微控制器家族的優(yōu)勢(shì)。”
Cortex-M7為高性能而生
ARM嵌入式市場(chǎng)營(yíng)銷副總裁Richard YORK表示:“智能硬件的發(fā)展勢(shì)不可擋,很多連網(wǎng)的智能嵌入式設(shè)備要求處理器提供更多的本地化處理功能,這對(duì)CPU的性能要求更高;此外,更多顯示、人機(jī)交互的語(yǔ)言識(shí)別需求也要求更高的CPU處理性能。順應(yīng)這兩大趨勢(shì),ARM推出了最新的Cortex-M7內(nèi)核?!?/p>
Cortex-M7目標(biāo)定位于Cortex-M系列最高性能的CPU內(nèi)核,針對(duì)諸如智能控制系統(tǒng)的高端嵌入式應(yīng)用,包括馬達(dá)控制、工業(yè)自動(dòng)化、先進(jìn)語(yǔ)音功能、圖像處理、各類連網(wǎng)交通工具應(yīng)用以及物聯(lián)網(wǎng)相關(guān)應(yīng)用。
相較于目前性能最高的ARM架構(gòu)微控制器,Cortex-M7可提升兩倍的運(yùn)算及數(shù)字信號(hào)處理性能,其性能測(cè)試結(jié)果高達(dá)5CoreMark/MHz,能夠更快速地處理音頻、影像數(shù)據(jù)及語(yǔ)音識(shí)別。Cortex-M7提供用于C語(yǔ)言的程序模型,且與現(xiàn)有Cortex-M系列產(chǎn)品二進(jìn)制兼容。憑借完整的生態(tài)系統(tǒng)與軟件兼容性,現(xiàn)有Cortex-M內(nèi)核能夠輕松遷移至Cortex-M7,設(shè)計(jì)人員可以重復(fù)利用各種程序代碼,降低研發(fā)及維護(hù)等成本。
Cortex-M7如何實(shí)現(xiàn)高性能?Richard YORK介紹,首先是采用分支預(yù)測(cè)的6級(jí)超標(biāo)量流水線,因此可同時(shí)支持單精度和雙精度浮點(diǎn)單元;二是支持64位的AXI AMBA4互聯(lián),可為高效內(nèi)存操作提供I-cache與D-cache;三是兼顧實(shí)時(shí)性、快速的相應(yīng)能力,支持12個(gè)周期的終端延遲。
值得一提的是,Cortex-M7在DSP性能方面進(jìn)行了大幅優(yōu)化,甚至比熱門的DSP產(chǎn)品更具競(jìng)爭(zhēng)力。Cortex-M7主要的DSP特征包括:讀取、內(nèi)存與MAC的平行操作;支持SIMD與單周期MAC;單精度與雙精度浮點(diǎn)單元;最小循環(huán)開銷(分支預(yù)測(cè)/BTAC);以及優(yōu)化的DSP庫(kù)。Richard YORK透露,ARM在規(guī)劃Cortex-M7時(shí),就希望能在某些應(yīng)用領(lǐng)域用高端MCU取代DSP。Cortex-M7內(nèi)核除了提供DSP的硬件部分,還配套DSP的軟件服務(wù),ARM Keil工具鏈幫助實(shí)現(xiàn)支持Cortex-M7的編制和調(diào)試,同時(shí)ARM軟件界面也支持底層標(biāo)準(zhǔn)算法和接口,包括DSP優(yōu)化算法。
圖:Cortex-M7方框圖
智能系統(tǒng)架構(gòu)提升STM32 F7處理性能
Daniel Colonna介紹,STM32 F7意在通過在Cortex-M7內(nèi)核外圍集成可互連的恰當(dāng)外設(shè),打造史上智能化程度最高的STM32微控制器。具體而言,STM32 F7采用兩個(gè)獨(dú)立機(jī)制取得零等待執(zhí)行性能:內(nèi)部閃存采用ST ART Accelerator訪存加速技術(shù);為外部存儲(chǔ)器(或內(nèi)部存儲(chǔ)器)提供一級(jí)高速緩存(4KB指令+4KB數(shù)據(jù)高速緩存)。AXI和先進(jìn)高性能總線矩陣(Multi-AHB, Advanced High-performance Bus),內(nèi)置雙通用直接訪存(DMA)控制器和以太網(wǎng)、通用串行總線On-the-Go高速(USB OTG HS, Universal Serial Bus On-the Go High Speed)和Chrom-ART Accelerator圖形硬件加速等設(shè)備專用DMA控制器。此外,具有大容量分布式架構(gòu)SRAM:在總線矩陣上有320KB共享數(shù)據(jù)存儲(chǔ)容量(包括240KB +16KB)和保存實(shí)時(shí)數(shù)據(jù)的64KB緊耦合存儲(chǔ)器(TCM, Tightly-Coupled Memory)數(shù)據(jù)RAM存儲(chǔ)器;保存關(guān)鍵程序的16KB指令TCM RAM存儲(chǔ)器;在低功耗模式下保存數(shù)據(jù)的4KB備份SRAM存儲(chǔ)器。
超出人們預(yù)期的是,STM32 F7的DSP性能是STM32 F4系列的2倍多,但其能耗并未犧牲。新系列運(yùn)行模式和低功耗模式(停止、待機(jī)和VBAT)的功耗與STM32 F4保在同一水平線上:工作模式能效為7 CoreMarks/mW;在低功耗模式下,當(dāng)上下文和SRAM內(nèi)容全都保存時(shí),典型功耗最低120 uA,典型待機(jī)功耗為1.7uA,VBAT模式典型功耗為0.1uA。
STM32 F7系列采用ST的90nm嵌入式非易失性存儲(chǔ)器CMOS制造工藝,這一工藝是STM32 F4產(chǎn)品于2011年發(fā)布至今Cortex-M微控制器領(lǐng)域性能最高的制造技術(shù),這也證明了ST正在履行“加快自己及客戶的創(chuàng)新,縮短上市時(shí)間”的承諾。隨著ST開始進(jìn)軍更先進(jìn)的技術(shù)節(jié)點(diǎn),面向未來的系統(tǒng)架構(gòu)有更大的空間提高微控制器的性能,據(jù)了解,ST的目標(biāo)是在下一個(gè)技術(shù)節(jié)點(diǎn)達(dá)到2000CoreMark。
評(píng)論