ARM Cortex-A 移動(dòng)處理器發(fā)展概覽
簡(jiǎn)介
本文引用地址:http://m.butianyuan.cn/article/201710/367207.htmARM Cortex-A 移動(dòng)應(yīng)用處理器產(chǎn)品線(xiàn)橫跨了幾代產(chǎn)品和三個(gè)主要產(chǎn)品類(lèi)別。有些開(kāi)發(fā)人員和 SoC 設(shè)計(jì)人員經(jīng)歷了一款或多款新型 ARM 處理器的推出過(guò)程,他們知道該產(chǎn)品線(xiàn)如何從單個(gè)高性能通用 CPU 設(shè)計(jì)演進(jìn)成為三個(gè)不同產(chǎn)品線(xiàn),分別面向高端、中端、入門(mén)級(jí)的移動(dòng)設(shè)備 SoC 市場(chǎng),這讓他們受益匪淺。
Cortex-A8
ARM 在 2005 年向市場(chǎng)推出 Cortex-A8 處理器,是第一款支持 armv7-a 架構(gòu)的處理器。ARMv7 包括 3 個(gè)關(guān)鍵要素:NEON 單指令多數(shù)據(jù) (SIMD) 單元、ARM trustZone 安全擴(kuò)展、以及thumb2 指令集,通過(guò) 16 位和 32 位混合長(zhǎng)度指令以減小代碼長(zhǎng)度。Cortex-A8 是 ARM 實(shí)現(xiàn)的第一個(gè)基于新ISA的超標(biāo)量處理器:它實(shí)現(xiàn)了完全雙發(fā)射流水線(xiàn),這意味著 cortex-a8 能夠同時(shí)發(fā)出在指令流中先后出現(xiàn)的任何兩個(gè)沒(méi)有數(shù)據(jù)依賴(lài)的指令。但是,它不能亂序來(lái)發(fā)射或撤銷(xiāo)指令 –該功能在之后的設(shè)計(jì)中才被實(shí)現(xiàn)。
當(dāng)我們推出 Cortex-A8 時(shí),很多合作伙伴認(rèn)為這款處理器放在移動(dòng)電話(huà)上是大材小用,他們很自然地質(zhì)疑道,“客戶(hù)會(huì)在手機(jī)上瀏覽互聯(lián)網(wǎng)?不太可能吧。”但是,我們和業(yè)界一些主要思想領(lǐng)袖合作,向客戶(hù)將會(huì)需要的產(chǎn)品邁進(jìn),尤其是因?yàn)楫?dāng) Cortex-A8 在 2008 年投入批量生產(chǎn)時(shí),高帶寬無(wú)線(xiàn)連接 (3G ) 已經(jīng)問(wèn)世,大屏幕也用于移動(dòng)設(shè)備。創(chuàng)新的移動(dòng)行業(yè)充分利用了該產(chǎn)品:Cortex-A8 芯片的推出正好趕上了智能手機(jī)出貨量猛增的大好時(shí)機(jī)。
Cortex-A9
推出 Cortex-A8 之后不久,ARM 又推出了首款多核 ARMv7 CPU:cortex-a9。Cortex-A9 利用硬件模塊來(lái)管理 CPU 集群中一至四個(gè)核心之間的高速緩存一致性,加入了一個(gè)外部二級(jí)高速緩存。理論上,客戶(hù)可以設(shè)計(jì)不包括二級(jí)緩存的小型版本 Cortex-A9,這種設(shè)計(jì)允許剔除管理高速緩存一致性的邏輯模塊,以實(shí)現(xiàn)尺寸更小的單核設(shè)計(jì)。但實(shí)際上,大多數(shù)設(shè)計(jì)都采用雙核個(gè)或更多核心并附帶二級(jí)高速緩存。此外,在2011 年底和 2012 年初,當(dāng)移動(dòng) SoC 設(shè)計(jì)人員可以采用多個(gè)核心之后,提高性能的突破點(diǎn)從提高單核性能轉(zhuǎn)移到提高核的數(shù)量。旗艦級(jí)高端移動(dòng) CPU迅速?gòu)淖畛醯碾p核拓?fù)浣Y(jié)構(gòu)移至四核 Cortex-A9。
除了開(kāi)啟了多核性能大門(mén)之外,與 Cortex-A8 相比,每個(gè) Cortex-A9 處理器的單時(shí)鐘周期指令吞吐量提高了大約 25%。這個(gè)性能的提升是在保持相似功耗和芯片面積的前提下, 通過(guò)縮短流水線(xiàn)并亂序執(zhí)行以及在流水線(xiàn)早期階段集成neon SIMD 和浮點(diǎn)功能而實(shí)現(xiàn)的。
Cortex-A15
隨著智能手機(jī)市場(chǎng)開(kāi)始加速發(fā)展,ARM 再次預(yù)見(jiàn)到了不斷發(fā)展的移動(dòng)系統(tǒng)對(duì)芯片性能提出的更高要求。為此ARM開(kāi)發(fā)了一款性能上大幅提升的處理器,用以專(zhuān)門(mén)針對(duì)新的高端移動(dòng)市場(chǎng)。在已經(jīng)非常強(qiáng)大的 Cortex-A9 的基礎(chǔ)上,ARM 憑借 cortex-a15 又將性能提高了 50% 以上。此外,Cortex-A15 引入了一系列架構(gòu)擴(kuò)展,從而實(shí)現(xiàn)了更大物理地址空間、硬件虛擬化支持和擴(kuò)展一致性。在 32 位系統(tǒng)中內(nèi)存被劃分為 2GB 設(shè)備內(nèi)存和 2GB 普通內(nèi)存,當(dāng)設(shè)備的 RAM 超出2GB的時(shí)候,擁有更大的物理地址空間就變得異常重要。ARM和其他合作伙伴也一直在探索虛擬化技術(shù)在商務(wù)移動(dòng)系統(tǒng)和自帶設(shè)備中的用戶(hù)操作系統(tǒng)以及類(lèi)似應(yīng)用情景進(jìn)行探索。。擴(kuò)展一致性在 big.LITTLE 處理器技術(shù)中被應(yīng)用的淋漓盡致,它提供了一種降低平均功耗并在功耗受限的條件下優(yōu)化達(dá)到最大性能的方法。
Cortex-A15 集群集成了監(jiān)聽(tīng)控制單元 (SCU) 以實(shí)現(xiàn)硬件一致性,每個(gè)集群包含一至四個(gè) CPU 核心,并集成二級(jí)高速緩存控制器 – Cortex-A15 之后的所有 ARM Cortex-A 系列 CPU 都沿用了這種拓?fù)浣Y(jié)構(gòu)。
在移動(dòng)設(shè)備中不斷突破性能極限
比較 Cortex-A 系列高端處理器的性能,可以看到自從 Cortex-A8 1GH 處理器在 2008 年上市以來(lái),性能有了大幅提升。
一致性擴(kuò)展機(jī)制,實(shí)現(xiàn)為 AMBA ACE, 使下圖所示的big.little SoC成為可能。在 big.LITTLE 系統(tǒng)中,通常實(shí)現(xiàn)一個(gè)“大”CPU 集群,并對(duì)其進(jìn)行調(diào)節(jié)以滿(mǎn)足高性能的要求,同時(shí)對(duì)“小”的 CPU 集群進(jìn)行調(diào)節(jié),滿(mǎn)足對(duì)高能效。在典型工作負(fù)載中,LITTLE 處理器可以處理絕大部分工作,而“big”CPU 集群的激活時(shí)間不足 10%,在很多情況下還達(dá)不到總 CPU 運(yùn)行時(shí)間的 1%。通過(guò) CoreLink CCI-400 高速緩存一致性互連組件,CPU 集群能夠監(jiān)聽(tīng)其他集群的高速緩存,從而實(shí)現(xiàn)軟件線(xiàn)程從一個(gè)集群到另一集群的快速轉(zhuǎn)移。
Cortex-A12
隨著智能手機(jī)市場(chǎng)的爆炸式增長(zhǎng),SoC 供應(yīng)商和 OEM 將該市場(chǎng)劃分為旗艦高端級(jí)別、中端級(jí)別、低成本入門(mén)級(jí)別。隨著這些細(xì)分市場(chǎng)的出現(xiàn),ARM 一直在定義專(zhuān)門(mén)針對(duì)上述三個(gè)級(jí)別市場(chǎng)的不同處理器。cortex-a12 是采用全新微架構(gòu)的一個(gè)全新處理器,專(zhuān)門(mén)面向快速發(fā)展的中端移動(dòng)市場(chǎng)。下圖顯示了這些細(xì)分市場(chǎng)的規(guī)模,以及面向這些細(xì)分市場(chǎng)的 ARM Cortex-A 產(chǎn)品:
Cortex-A12 的設(shè)計(jì)面向中端移動(dòng) SoC,以滿(mǎn)足這一細(xì)分市場(chǎng)對(duì)于芯片面積和功耗的要求。它使用無(wú)序雙執(zhí)行流水線(xiàn),其性能比當(dāng)前在許多中端移動(dòng) SoC 中使用的 Cortex-A9 高出 40%。Cortex-A12 在 2013 年中推向市場(chǎng),有望在 2014 投入量產(chǎn)。它是一款 32 位處理器,具有與 Cortex-A15 相同的物理地址擴(kuò)展和相關(guān)的架構(gòu)特性。
Cortex-A12 能夠在很多(但并非全部)用例中提供接近 Cortex-A15 的性能。Cortex-A12 還針對(duì)中端移動(dòng)設(shè)計(jì)進(jìn)行了優(yōu)化,取消了一些企業(yè)功能,使用略微簡(jiǎn)單的流水線(xiàn),因此在橫跨多個(gè)市場(chǎng)的高端設(shè)備上都可以找到Cortex-A15的身影,而 Cortex-A12 則專(zhuān)門(mén)面向中端移動(dòng)設(shè)計(jì)。
Cortex-A57
cortex-a57 是 ARM 針對(duì) 2013 年、2014 年和 2015 年設(shè)計(jì)起點(diǎn)的 CPU 產(chǎn)品系列的旗艦級(jí) CPU,它采用 armv8-a 架構(gòu),提供 64 位功能,而且通過(guò) Aarch32 執(zhí)行狀態(tài),保持與 ARMv7 架構(gòu)的完全后向兼容性。在高于 4GB 的內(nèi)存廣泛使用之前,64 位并不是移動(dòng)系統(tǒng)真正必需的,即便到那時(shí)也可以使用擴(kuò)展物理尋址技術(shù)來(lái)解決,但盡早推出 64 位,可以實(shí)現(xiàn)更長(zhǎng)、更順暢的軟件遷移,讓高性能應(yīng)用程序能夠充分利用更大虛擬地址范圍來(lái)運(yùn)行內(nèi)容創(chuàng)建應(yīng)用程序,例如視頻編輯、照片編輯和增強(qiáng)現(xiàn)實(shí)。新架構(gòu)可以運(yùn)行 64 位操作系統(tǒng),并在操作系統(tǒng)上無(wú)縫混合運(yùn)行 32 位和 64 位應(yīng)用程序。ARMv8 架構(gòu)可以實(shí)現(xiàn)狀態(tài)之間的輕松轉(zhuǎn)換。
除了 ARMv8 的架構(gòu)優(yōu)勢(shì)之外,Cortex-A57 還提高了單個(gè)時(shí)鐘周期性能,比高性能 的Cortex-A15 CPU 高出了 20% 至 40%。它還改進(jìn)了二級(jí)高速緩存的的設(shè)計(jì)以及內(nèi)存系統(tǒng)的其他組件,極大的提高了能效。Cortex-A57 將為移動(dòng)系統(tǒng)提供前所未有的高能效性能水平,而借助 big.LITTLE,SoC 能以很低的平均功耗做到這一點(diǎn)。
高效率產(chǎn)品線(xiàn):Cortex-A5、Cortex-A7、Cortex-A53
隨著智能手機(jī)市場(chǎng)的崛起,最先出現(xiàn)的市場(chǎng)是入門(mén)級(jí)市場(chǎng)。在新興市場(chǎng),移動(dòng)設(shè)備沒(méi)有獲得無(wú)線(xiàn)運(yùn)營(yíng)商的補(bǔ)貼,因此用戶(hù)必須支付全價(jià)來(lái)購(gòu)買(mǎi)移動(dòng)設(shè)備,并且按月支付合約的服務(wù)費(fèi)用。新興市場(chǎng)的價(jià)格范圍在 150 美元以下,并將很快降至 75 美元以下 – 我們需要一種不同類(lèi)型的 SoC 設(shè)計(jì)來(lái)滿(mǎn)足這些市場(chǎng)的需求。在 Cortex-A9 發(fā)布之后不久,ARM 試圖開(kāi)發(fā)一款處理器來(lái)滿(mǎn)足這一市場(chǎng)需求:這款產(chǎn)品的尺寸和功耗與舊款 ARM926 等功能性手機(jī)處理器大致相同,但性能高于在第一代智能手機(jī)中使用的 arm11 系列。2009 年,我們發(fā)布了 Cortex-A5,該設(shè)計(jì)通過(guò)有序單執(zhí)行 8 級(jí)流水線(xiàn)實(shí)現(xiàn)了上述目標(biāo)。利用這種簡(jiǎn)單流水線(xiàn)設(shè)計(jì),我們可將功耗保持在非常低的水平。而簡(jiǎn)化的功能集,造就了ARM 有史以來(lái)最高效的(每 mW 性能)應(yīng)用處理器。
在 cortex-a5 取得成功的基礎(chǔ)上ARM又設(shè)計(jì)了目前已在入門(mén)級(jí)智能手機(jī)中得到大量應(yīng)用cortex-a7 處理器,形成了一個(gè)充滿(mǎn)活力的智能手機(jī)處理器細(xì)分市場(chǎng)。隨著 Cortex-A5 取得成功,下一個(gè)目標(biāo)是開(kāi)發(fā)能夠匹配 Cortex-A15 的架構(gòu)功能集的類(lèi)似處理器,從而在 big.LITTLE 配對(duì)中將其與 Cortex-A15 結(jié)合使用。同時(shí),該款處理器還應(yīng)該在 Cortex-A5 的基礎(chǔ)上提升性能,并具有與之相同的功效、和相似的功耗以及芯片大小。Cortex-A7 通過(guò)添加部分雙執(zhí)行,增加TLB 和內(nèi)存結(jié)構(gòu),同時(shí)集成二級(jí)高速緩存,將單時(shí)鐘周期性能提高了 20%。
高能效 CPU 產(chǎn)品線(xiàn)的最新成員利用了相同的 8 級(jí)有序流水線(xiàn),但通過(guò)多種方式顯著提升了性能,包括完全雙執(zhí)行流水線(xiàn)、更寬的內(nèi)部總線(xiàn)、增強(qiáng)浮點(diǎn)和 SIMD 吞吐容量、更大的TLB,以及其他對(duì)存儲(chǔ)器系統(tǒng)的改進(jìn)。cortex-a53 包括可選 內(nèi)部RAM ECC 保護(hù),還提供外部總線(xiàn)選項(xiàng),使得該處理器在移動(dòng)和企業(yè)應(yīng)用中都可以部署。
除了微架構(gòu)性能改進(jìn)之外,Cortex-A53 還增加了對(duì) ARMv8 架構(gòu)的支持,為獨(dú)立入門(mén)級(jí)移動(dòng)芯片設(shè)計(jì),和包含多個(gè) Cortex-A53 集群的可擴(kuò)展企業(yè)應(yīng)用引入 64 位功能,同時(shí)在高端移動(dòng)系統(tǒng)中,將Cortex-A53和性能更強(qiáng)的Cortex-A57在big.LITTLE系統(tǒng)設(shè)計(jì)中配對(duì)使用。
下圖顯示了連續(xù)幾代高能效Cortex-A CPU 的性能對(duì)比。因?yàn)椴捎米钚碌脑O(shè)計(jì) Cortex-A53 能夠提供比僅僅幾年前的旗艦級(jí) CPU (Cortex-A9)出色的多性能。下圖顯示的性能比較測(cè)試是在相同頻率下進(jìn)行的。在物理實(shí)現(xiàn)中,Cortex-A53、Cortex-A7 和 Cortex-A5 的 8 級(jí)流水線(xiàn)達(dá)到的頻率和采用更長(zhǎng)流水線(xiàn)的“big” Cortex-A CPU能達(dá)到的頻率差距在15%之內(nèi)。實(shí)際量產(chǎn) SoC 頻率存在很大差異,取決于流程選項(xiàng)和后端設(shè)計(jì),我們已經(jīng)看到 Cortex-A7 在采用 28nm制程下可以達(dá)到 1.2GHz、1.5GHz 甚至更高的頻率。
有關(guān) ARM 的高效率產(chǎn)品線(xiàn)的更多信息,請(qǐng)參閱 Kinjal Dave 的博客 – 高效率、中端或高性能 Cortex-A – 差異何在?
有關(guān) Cortex-A53 的更多信息,請(qǐng)參閱我早期的關(guān)于最新高效率 Cortex-A CPU 的博客 – 有關(guān) Cortex-A53 的 5 大必備知識(shí)
移動(dòng)應(yīng)用處理器全面路線(xiàn)圖
本路線(xiàn)圖將上述所有處理器都集中在單個(gè)圖表中,展示了 ARM所提供的高性能級(jí)別、中端級(jí)別、入門(mén)級(jí)別的移動(dòng)應(yīng)用程序處理器,以及所支持的高速緩存一致性互聯(lián)組件。
以上路線(xiàn)圖展示了ARM 三個(gè)級(jí)別的移動(dòng)應(yīng)用處理器產(chǎn)品路線(xiàn)圖,我們未來(lái)產(chǎn)品的開(kāi)發(fā)也將繼續(xù)遵循這一路線(xiàn)。我們專(zhuān)門(mén)針對(duì)高端、中端和高效率這三個(gè)細(xì)分市場(chǎng)的處理器設(shè)計(jì),使我們能夠提供針對(duì)這三級(jí)智能手機(jī)和平板電腦市場(chǎng)的定制產(chǎn)品。
為適當(dāng)任務(wù)尋找適當(dāng)處理器不再是難以決斷的選擇
ARM 的 big.LITTLE 技術(shù)旨在為消費(fèi)者提供最佳整體用戶(hù)體驗(yàn) – 包括按需動(dòng)態(tài)性能、更高的能效、“不發(fā)熱”的耐用器件。市場(chǎng)上最早利用該技術(shù)的產(chǎn)品包括三星 GS4(國(guó)際版)和三星 Note 3(國(guó)際版)
下圖顯示了將在 2013 年和 2014 年推出的采用未來(lái)設(shè)計(jì)的高端移動(dòng) CPU 子系統(tǒng),將在 2014 年和 2015 年的設(shè)備中使用。它采用 big.LITTLE 電源管理技術(shù),利用 Cortex-A57 的強(qiáng)大性能,并且提供高速緩存一致性互聯(lián) (cci) 功能,能夠?yàn)镚PU 計(jì)算提供的 IO 一致性的支持。
有關(guān) big.LITTLE 的更多詳細(xì)信息,請(qǐng)參見(jiàn)我近期在 ARM TechCon 2013上進(jìn)行的有關(guān) big.LITTLE 平臺(tái)測(cè)量結(jié)果的演示(旨在展示性能改進(jìn)和節(jié)能):big.LITTLE 技術(shù)向完全異構(gòu)全局任務(wù)調(diào)度邁進(jìn) - Techcon 演示文稿
另外,您可能希望閱讀我早期論述該技術(shù)要點(diǎn)的博客 – 有關(guān) big.LITTLE 的十大必備知識(shí)
以上系統(tǒng)示意圖展示了最先進(jìn)的移動(dòng) CPU 設(shè)計(jì),它采用 Cortex-A57 和 Cortex-A53 處理器,并且結(jié)合最新的 mali_t760 GPU。請(qǐng)注意,它具有 2 個(gè) big 核心。從我們已經(jīng)進(jìn)行的性能測(cè)試來(lái)看,2 個(gè) big 核心似乎已經(jīng)能滿(mǎn)足當(dāng)前工作負(fù)載。采用由Cortex-A15和Cortex-A7構(gòu)成的當(dāng)前最高端的移動(dòng) SoC的拓?fù)浣Y(jié)構(gòu)示意圖和下圖也是非常類(lèi)似。Cortex-A50 系列處理器代表了將在 2014 年間問(wèn)世的移動(dòng) SoC 的未來(lái)拓?fù)浣Y(jié)構(gòu)發(fā)展趨勢(shì) … 但 ARM 不會(huì)就此止步。我們將繼續(xù)在低功耗 CPU、GPU 和系統(tǒng)設(shè)計(jì)領(lǐng)域開(kāi)發(fā)新的創(chuàng)新技術(shù),以此推動(dòng)智能手機(jī)、平板電腦和新興設(shè)備類(lèi)型的創(chuàng)新,實(shí)現(xiàn)高效移動(dòng)計(jì)算,提升全球數(shù)十億用戶(hù)的生活質(zhì)量。
評(píng)論