芯片設(shè)計(jì)規(guī)則，正在悄然變革！

發(fā)布人：旺材芯片時(shí)間：2022-04-11 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

來源：半導(dǎo)體行業(yè)觀察

多年來，移動(dòng)處理器的生產(chǎn)商致力于優(yōu)化設(shè)計(jì)，以在有限的功耗預(yù)算、存儲(chǔ)空間和帶寬范圍內(nèi)獲得最佳性能。過去，顯然這些考量因素在數(shù)據(jù)中心或個(gè)人電腦（PC）等市場(chǎng)并未得到重視。如今，傳統(tǒng)數(shù)據(jù)中心和PC市場(chǎng)的變革正在悄然發(fā)生——改變處理器設(shè)計(jì)規(guī)則，讓開發(fā)人員重新考慮其芯片架構(gòu)以獲得更高的性能功耗比。

移動(dòng)處理器設(shè)計(jì)原則運(yùn)用于PC和數(shù)據(jù)中心

今天，越來越多的云游戲、數(shù)據(jù)挖掘、人工智能/數(shù)據(jù)分析和高性能計(jì)算均在云端實(shí)現(xiàn)。雖然這些應(yīng)用的要求各不相同，但在不斷提高計(jì)算量的要求方面如出一轍。

數(shù)據(jù)中心無法通過不斷擴(kuò)大物理占地面積來滿足這一需求。為了將運(yùn)營(yíng)支出（OpEx）保持在可接受的范圍內(nèi)，以及實(shí)現(xiàn)凈零（Net Zero）目標(biāo)，企業(yè)需要在有限的空間內(nèi)增加計(jì)算密度，從而獲得更高的計(jì)算性能。圖形處理器（GPU）、中央處理器（CPU）、人工智能（AI）加速器等處理元件必須在最小的功耗/散熱和面積預(yù)算內(nèi)實(shí)現(xiàn)最高的性能。為此，遵循移動(dòng)設(shè)計(jì)原則進(jìn)行處理器的設(shè)計(jì)是一個(gè)理想的出發(fā)點(diǎn)。

分析PC市場(chǎng)的趨勢(shì)，也可以得出相似的結(jié)論。在傳統(tǒng)PC模式下，大部分功能被各自集成為一個(gè)個(gè)的獨(dú)立模組。但是，隨著大多數(shù)組織希望擴(kuò)大混合辦公模式，人們逐漸用筆記本電腦取代臺(tái)式機(jī)。將越來越多的功能（包括圖形處理、神經(jīng)網(wǎng)絡(luò)加速、安全、I/O等）集成到具有統(tǒng)一存儲(chǔ)器架構(gòu)的單個(gè)系統(tǒng)級(jí)芯片（SoC）中，既可以提高性能，又能將功耗保持在最低水平。因此，下一代PC處理器看起來越來越像是智能手機(jī)處理器。

大型科技公司借助定制芯片設(shè)計(jì)實(shí)現(xiàn)差異化

隨著摩爾定律的終結(jié)，行業(yè)再也不可能每?jī)赡瓿霈F(xiàn)一次性能提升。在此背景下，企業(yè)紛紛加入這場(chǎng)設(shè)計(jì)“競(jìng)賽”，爭(zhēng)相以最佳的芯片，打造最好的用戶體驗(yàn)。

全球大型科技公司早已深諳此道，有備而來。它們正著力自主設(shè)計(jì)定制芯片，以用于消費(fèi)類產(chǎn)品、PC或數(shù)據(jù)中心等。這些公司從現(xiàn)成可用的芯片轉(zhuǎn)向定制芯片，寄厚望于更好地掌控設(shè)計(jì)，贏得優(yōu)勢(shì)。因此，我們看到亞馬遜投資于Graviton CPU設(shè)計(jì)，谷歌推出了以TPU為中心的Tensor CPU。蘋果公司的M1處理器將為Mac電腦帶來一款借助移動(dòng)設(shè)計(jì)原則進(jìn)行優(yōu)化的芯片，提供更高的集成度和更出眾的性能功耗比。

OEM替代方案

對(duì)于沒有內(nèi)部硬件和軟件設(shè)計(jì)團(tuán)隊(duì)，尚未著手開發(fā)定制芯片的原始設(shè)備制造商（OEM）而言，他們面臨的挑戰(zhàn)在于如何讓自己的設(shè)計(jì)脫穎而出，與高度優(yōu)化的架構(gòu)相媲美。這些OEM使用的芯片大部分都是現(xiàn)成可用的，可能會(huì)使他們處于劣勢(shì)。許多為PC和數(shù)據(jù)中心設(shè)計(jì)的芯片是“暴力”解決方案，雖然可以提供所需的性能，但通常過于耗電，太占用內(nèi)存/帶寬，缺乏競(jìng)爭(zhēng)力。此外，這些芯片在可用的特定軟件和操作系統(tǒng)方面也存在限制。

部分移動(dòng)市場(chǎng)的SoC供應(yīng)商開始進(jìn)入數(shù)據(jù)中心和PC市場(chǎng)，期望瓜分現(xiàn)有玩家的部分市場(chǎng)份額，但它們的數(shù)量少之又少，很難幫助OEM廠商實(shí)現(xiàn)既創(chuàng)新又控制成本的差異化。因此，一些行業(yè)替代方案正在應(yīng)運(yùn)而生。我們不乏看到很多廠商正在考慮基于RISC-V架構(gòu)的CPU解決方案。但是，單一的CPU設(shè)計(jì)無法完全解決OEM目前面臨的激烈的競(jìng)爭(zhēng)困局。OEM需要放眼整個(gè)數(shù)據(jù)中心的架構(gòu)結(jié)構(gòu)提升整體方案的創(chuàng)新，從而增加自身的競(jìng)爭(zhēng)力。

可擴(kuò)展的異構(gòu)架構(gòu)是關(guān)鍵

通過異構(gòu)計(jì)算，靈活利用CPU,GPU等計(jì)算單元，實(shí)現(xiàn)硬件最大利用率以達(dá)到計(jì)算性能的優(yōu)化提升，同時(shí)滿足效率和功耗比優(yōu)化。異構(gòu)計(jì)算架構(gòu)為數(shù)據(jù)中心不斷提高的計(jì)算量要求提供了靈活陣列工作方案。目前很多半導(dǎo)體廠商都在研究相關(guān)的產(chǎn)品和應(yīng)用，以賦能OEM市場(chǎng)競(jìng)爭(zhēng)力。傳統(tǒng)的GPU IP公司Imagination就在去年推出了其CPU產(chǎn)品線，并強(qiáng)化了異構(gòu)計(jì)算的研發(fā)，意圖通過產(chǎn)品組合的優(yōu)化提升，給客戶提供更加完善的異構(gòu)計(jì)算解決方案，從而更好的服務(wù)客戶以適應(yīng)未來高性能計(jì)算的需求。

移動(dòng)GPU奠定基礎(chǔ)

移動(dòng)GPU是打造高效異構(gòu)設(shè)計(jì)的理想切入點(diǎn)。與試圖將高端GPU強(qiáng)行納入移動(dòng)功耗預(yù)算范圍相比，把移動(dòng)GPU升級(jí)應(yīng)用于數(shù)據(jù)中心和PC領(lǐng)域?qū)⒏佑幸饬x。因?yàn)橐苿?dòng)GPU天生為”小而美”而生。移動(dòng)GPU廠商開發(fā)擁有很多專利技術(shù)，以最大程度的實(shí)現(xiàn)GPU高性能低功耗。在數(shù)據(jù)中心和PC粗放式單一追求高性能GPU的背景下，這些技術(shù)優(yōu)勢(shì)可以讓移動(dòng)GPU廠商更加具有競(jìng)爭(zhēng)優(yōu)勢(shì)，并給OEM提供更多的管理附加價(jià)值。

提到移動(dòng)GPU的專利技術(shù)，不得不又再次提及Imagination這家專注于GPU設(shè)計(jì)的老牌企業(yè)。和它的對(duì)手相比，Imagination多年來把主要精力放在了GPU領(lǐng)域的研究中，尤其是在更復(fù)雜的GPU渲染領(lǐng)域，Imagination是很多技術(shù)的先驅(qū)開發(fā)者，例如GPU硬件虛擬化，分塊式延遲渲染（TBDR）,實(shí)時(shí)硬件光線追蹤（Ray Tracing)等。分塊式延遲渲染（TBDR）技術(shù)是將幾何數(shù)據(jù)分割成小區(qū)域（圖塊），并統(tǒng)一處理。由于每個(gè)圖塊都經(jīng)過光柵化和單獨(dú)處理，渲染的尺寸非常小，因此可以將所有數(shù)據(jù)保存在快速運(yùn)行的片上存儲(chǔ)器中。這項(xiàng)技術(shù)為M1的圖形處理奠定了基礎(chǔ)。

對(duì)于諸如安卓云游戲等應(yīng)用場(chǎng)景，數(shù)據(jù)中心需要靈活處理多個(gè)用戶的不同游戲消費(fèi)場(chǎng)景。在多個(gè)小型GPU上處理多個(gè)小型并發(fā)工作負(fù)載的方法比使用傳統(tǒng)桌面GPU更高效。云游戲產(chǎn)業(yè)鏈都在強(qiáng)化GPU硬件虛擬化技術(shù)的開發(fā)應(yīng)用以降低成本。移動(dòng)GPU通過向上擴(kuò)展分散式多核移動(dòng)GPU架構(gòu)，使每個(gè)GPU既可支持更多用戶，同時(shí)為云端的許多用戶提供更高的能效。

以芯動(dòng)科技（Innosilicon）為例，作為國(guó)產(chǎn)高端GPU第一芯的行業(yè)領(lǐng)頭羊，該公司基于Imagination移動(dòng)GPU IP的基礎(chǔ)上，把移動(dòng)GPU架構(gòu)向上擴(kuò)展至高性能服務(wù)器級(jí)別的硬件，旨在打破臺(tái)式機(jī)顯卡市場(chǎng)的現(xiàn)有格局。在這個(gè)長(zhǎng)期由雙寡頭壟斷的高端市場(chǎng)中，沒有人預(yù)料到會(huì)出現(xiàn)新的競(jìng)爭(zhēng)對(duì)手，但芯動(dòng)科技正在利用不斷變化的市場(chǎng)力量和高度可擴(kuò)展的高效技術(shù)提供替代方案。

增加高效的片上AI處理（正如M1所示）是OEM的另一個(gè)機(jī)會(huì)。由于片上AI處理尚未成為PC的標(biāo)準(zhǔn)，OEM可以利用這項(xiàng)能力來支持超分辨率降噪、音頻命令、安全等新興應(yīng)用。這種AI功能通常需要巨大的計(jì)算能力，而使用基于移動(dòng)設(shè)計(jì)原則設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)加速器（NNA）IP便可以在SoC上集成高效、高度可靠的AI推理功能。在端側(cè)的AI邊緣加速器領(lǐng)域，相較于其他競(jìng)爭(zhēng)對(duì)手，Imagination的NNA邊緣加速器硬件不僅繼承了其GPU設(shè)計(jì)的高性能低功耗的DNA，同時(shí)在不同的數(shù)量級(jí)的計(jì)算領(lǐng)域都有高于競(jìng)爭(zhēng)對(duì)手的優(yōu)異表現(xiàn)。

設(shè)計(jì)專用芯片——不僅服務(wù)于大型科技公司

SoC制造商需要通過基于移動(dòng)設(shè)計(jì)原則設(shè)計(jì)的可擴(kuò)展IP內(nèi)核，以創(chuàng)造高能效、高帶寬和高性能的設(shè)計(jì)。借助這種專為異構(gòu)架構(gòu)設(shè)計(jì)的處理器，他們可以創(chuàng)建專用、高效的新型解決方案。這可以幫助OEM提供極具競(jìng)爭(zhēng)力和差異化的產(chǎn)品，牢牢把握企業(yè)的未來發(fā)展方向。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

芯片設(shè)計(jì)規(guī)則，正在悄然變革！

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

芯片設(shè)計(jì)規(guī)則，正在悄然變革！

相關(guān)推薦

技術(shù)專區(qū)

芯片設(shè)計(jì)規(guī)則，正在悄然變革！