ARM的新CPU和GPU核能否沖擊英特爾老巢？

作者：時(shí)間：2018-06-22 來源：集微網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

編者按：在連續(xù)創(chuàng)造驚人的數(shù)字之后，ARM的目光更為長(zhǎng)遠(yuǎn)，除著力渲染可將智能手機(jī)實(shí)現(xiàn)PC性能之外，染指筆記本電腦市場(chǎng)的野心愈加明晰。

　　在連續(xù)創(chuàng)造驚人的數(shù)字之后，ARM的目光更為長(zhǎng)遠(yuǎn)。據(jù)最新數(shù)據(jù)顯示，截止2017年底基于Arm的芯片出貨量已達(dá)1200億片，約占整體市場(chǎng)四成份額。Arm資深市場(chǎng)營(yíng)銷總監(jiān)Ian Smythe表示，到目前為止基于Arm的芯片出貨量應(yīng)已突破1300億，未來將邁向2000億。2035年預(yù)計(jì)將有一萬億的互聯(lián)設(shè)備，而5G、AI、安全、全計(jì)算等技術(shù)將大行其道，以為用戶提供更自由更互連的浸入式體驗(yàn)?；诖薃rm IP產(chǎn)品線再添生力軍，在CPU和GPU層面均實(shí)現(xiàn)躍升，除著力渲染可將智能手機(jī)實(shí)現(xiàn)PC性能之外，染指筆記本電腦市場(chǎng)的野心愈加明晰。

本文引用地址：http://m.butianyuan.cn/article/201806/382031.htm

　　Cortex-A76的野心

　　去年Arm發(fā)布的Cortex-A75針對(duì)AI和ML能力進(jìn)行了特別優(yōu)化，同時(shí)引入了TrustZone技術(shù)(芯片級(jí)安全技術(shù))和DynamIQ big.LITTLE拓?fù)涮匦?。而今年Arm宣布最新旗艦CPU——Cortex-A76，相比上一代在性能上實(shí)現(xiàn)了35%的提升，同時(shí)降低了40%的功耗，并在機(jī)器學(xué)習(xí)能力上提升了4倍。

　　“實(shí)現(xiàn)上述進(jìn)步的原因在于，Cortex-A76雖采用和前一代相同的v8.2指令集，但內(nèi)建的微處理器架構(gòu)則是從頭開始研發(fā)，實(shí)現(xiàn)了諸多重大改進(jìn)，包括解耦合分支預(yù)測(cè)與指令預(yù)取、譯碼寬度更大、更高的整數(shù)與向量與浮點(diǎn)運(yùn)算單元等。同時(shí)，Cortex-A76是針對(duì)7nm工藝定制的全新架構(gòu)，在搭配7nm工藝時(shí)主頻可達(dá)到3.0GHz。”Ian Smythe強(qiáng)調(diào)。

　　這一性能相當(dāng)于PC端英特爾旗下的酷睿i5-7300，如果SoC廠商緩存設(shè)計(jì)得更好，其性能甚至可以媲美i7。聯(lián)想到此前新一代高通驍龍1000版Windows 10ARM筆記本，表明Arm正著力染指PC市場(chǎng)，但能否借Cortex-A76挑戰(zhàn)英特爾/AMD在PC領(lǐng)域的權(quán)威還待合作伙伴的力道以及生態(tài)的配合。同時(shí)Cortex-A76還意欲為智能手機(jī)帶來筆記本級(jí)別的性能，過發(fā)揮比前一代產(chǎn)品高達(dá)4倍的機(jī)器學(xué)習(xí)性能，解決云端持續(xù)互動(dòng)衍生出的延遲以及安全方面的問題。Cortex-A76可謂“身兼重任”。

　　此外，Arm還提供獨(dú)特的POP技術(shù)。Ian Smythe提及，基于臺(tái)積電16FFC的Cortex-A76 POP IP，可提供目前最佳性能;而對(duì)于那些尋求頂尖制程并鎖定高端應(yīng)用的客戶，使用臺(tái)積電7FF制程的Cortex-A76和Cortex-A55 POP IP將于2018年第四季度上市。Arm POP IP可加速產(chǎn)品的實(shí)現(xiàn)，縮短上市時(shí)間，并充分利用DynamIQ big.LITTLE的靈活性。

　　GPU和VPU的跨越

　　GPU可說是Arm未來要發(fā)展AI計(jì)算生態(tài)的主要角色，從第一代BiFrost架構(gòu)開始，就已經(jīng)針對(duì)AI計(jì)算所需要的各種場(chǎng)景，包含機(jī)器學(xué)習(xí)中的訓(xùn)練以及推理加速等進(jìn)行優(yōu)化。時(shí)間節(jié)點(diǎn)到了2018年中，Mali-G76新晉成為Arm最新旗艦GPU。

　　“Mali-G76仍采用Bifrost架構(gòu)，總核配置上限從32核降為20核，每個(gè)核心仍然是3個(gè)執(zhí)行單元，但執(zhí)行單元的線程數(shù)增加到8條，也就是每核心24條線程。加上配備texture mapper以及緩存器的優(yōu)化等，再度提升了30%的性能密度以及30%的能源效率。在7nm工藝的加持下，其性能可提升1.5-2倍?！盜an Smythe介紹說，“而且新GPU通過支持int8 dot實(shí)現(xiàn)了強(qiáng)大的機(jī)器學(xué)習(xí)功能，表現(xiàn)足足是Mali-G72的2.7倍?！?/p>

　　除在GPU領(lǐng)域精進(jìn)之外，面向未來的8K視覺體驗(yàn)，Arm推出了最新的高端視頻處理器(VPU)Mali-V76來占領(lǐng)先機(jī)。

　　Ian Smythe介紹，8K60規(guī)格串流需要4K60格式的視頻4倍的帶寬，為此Arm通過加入額外的AXI總線，使處理量增加一倍。此外還將行緩沖區(qū)從4096個(gè)像素增加到8192個(gè)，從而帶來額外的效能提升，使得Mali-V76不僅支持8k60解碼和8k30編碼，性能亦幾乎是上一代產(chǎn)品的兩倍。

　　即使是當(dāng)前的高端設(shè)備，4K仍未成為標(biāo)準(zhǔn)配備，那么為何市場(chǎng)已開始提前鎖定8K?Ian Smythe認(rèn)為，產(chǎn)業(yè)局勢(shì)瞬息萬變，Arm必須針對(duì)未來設(shè)備的需求提前準(zhǔn)備。在未來的高端電視以及更高分辨率的AR/VR頭顯領(lǐng)域，Mali-V76將發(fā)揮更大作用。而對(duì)于一個(gè)8K視頻流的替代方案而言，可選擇支持4個(gè)60fps的4K視頻流。

　　AI仍“借力使力”

　　雖然在AI布局上，Arm看似慢了半拍。但事實(shí)上，ARM早在2016年就已經(jīng)把觸手伸進(jìn)多個(gè)AI應(yīng)用領(lǐng)域同時(shí)發(fā)展，包含號(hào)稱針對(duì)機(jī)器學(xué)習(xí)優(yōu)化的Bifrost GPU 架構(gòu)，以及針對(duì)高端服務(wù)器芯片的SVE延伸指令集。隨著相關(guān)方案陸續(xù)成熟，采用者也逐漸增加，Arm在今年2月推出Project Trillium，結(jié)合開發(fā)環(huán)境、算法與各大主流機(jī)器學(xué)習(xí)框架，布局從終端到云端所有AI應(yīng)用開發(fā)生態(tài)。

　　而此次推出的無論是CPU還是GPU，在AI性能上均實(shí)現(xiàn)了大幅提升，表明Arm的AI布局亦在穩(wěn)妥推進(jìn)。

　　至于沒有推出單獨(dú)的AI加速器原因，Ian Smythe特意指出，目前AI還處于初級(jí)階段，雖然某些廠商選擇配備單獨(dú)的AI加速器，但仍有一些合作伙伴配備GPU來對(duì)AI方案進(jìn)行調(diào)適，以其靈活性來進(jìn)行定制化設(shè)計(jì)，并可獲得Arm生態(tài)體系的廣泛支持。

　　在近兩年的AI熱潮中，各家新創(chuàng)產(chǎn)業(yè)紛紛推出自有的AI加速器，群雄并起。但Arm仍如此“氣定神閑”沒有染指AI加速器內(nèi)核，或許有更深的考量。但是，無論是對(duì)算法的承載，對(duì)計(jì)算的優(yōu)化，對(duì)AI生態(tài)的構(gòu)建，Arm的時(shí)間或許沒有想象那么從容。

新聞中心

ARM的新CPU和GPU核能否沖擊英特爾老巢？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)