AMD即將帶來(lái)更多驚喜
去年 11 月,AMD 展示了其最新的主流數(shù)據(jù)中心芯片后,Epyc 處理器設(shè)計(jì)師有望將其用在即將推出的云、人工智能和高性能計(jì)算的專(zhuān)用組件上。
本文引用地址:http://m.butianyuan.cn/article/202306/447315.htm6 月 13 日,AMD 公司 CEO Lisa Su 將向業(yè)界展示更多技術(shù)和產(chǎn)品,我們先在這里做一些「劇透」。
AMD 將向數(shù)據(jù)中心推送 APU
考慮到最近圍繞生成 AI 的所有炒作,讓我們從 AMD 的加速處理單元 (APU) Instinct MI300A 開(kāi)始。
APU 一直是 AMD PC 和嵌入式電子產(chǎn)品陣容的支柱:它們具有帶內(nèi)置圖形處理器的 CPU 集群,可以處理計(jì)算和并行處理工作負(fù)載的組合。
與個(gè)人計(jì)算不同,MI300A 將有一個(gè)截然不同的關(guān)鍵點(diǎn):AI/ML 和高性能計(jì)算。事實(shí)上,我們現(xiàn)在知道該芯片將成為美國(guó)勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室即將推出的 El Capitan 超級(jí)計(jì)算機(jī)的大腦。
MI300A 也不同于迄今為止從 AMD 看到的任何 APU,除了一個(gè),早在 2017 年,英特爾和 AMD 就聯(lián)手將英特爾 CPU 芯片與 AMD Radeon GPU 和 HBM2 內(nèi)存配對(duì)。MI300A 將遵循類(lèi)似的模式,但它將使用 AMD 的 Zen 系列內(nèi)核,而不是英特爾 CPU 內(nèi)核,并提供更多的 GPU 性能。
到目前為止,AMD 一直守口如瓶,但有內(nèi)部人士透露,MI300A 將配備 24 個(gè) Zen 4 內(nèi)核、128GB HBM3 內(nèi)存,從渲染圖來(lái)看似乎是 6 個(gè) CDNA GPU 芯片。
奇怪的是,看起來(lái) AMD 可能沒(méi)有使用去年 Epyc 4 Genoa 系列中發(fā)現(xiàn)的 Chiplet(小芯片)架構(gòu)。MI300A 渲染圖似乎顯示了兩個(gè)核心復(fù)合芯片 (CCD)——AMD 稱(chēng)之為 CPU 小芯片。從這張圖片來(lái)看,AMD 實(shí)際上可能使用兩個(gè) 16 核 CCD,就像我們期望在 Bergamo 上找到的那樣,而不是兩個(gè) 12 核 CCD。雙 16 核 CCD 的內(nèi)核太多,但 AMD 禁用其 CCD 上的內(nèi)核的情況并不少見(jiàn)。
如果事實(shí)確實(shí)如此,AMD 這樣做可能是為了在給定的功率預(yù)算下保持更高的核心時(shí)鐘頻率。
AMD 透露,與支持 1.1 exaFLOPS Frontier 超級(jí)計(jì)算機(jī)的 MI250X 相比,該芯片的人工智能性能將提高 8 倍,每瓦性能提高 5 倍。這種提升的很大一部分可能來(lái)自這次增加的 FP8 支持。較低的精度通常會(huì)以降低準(zhǔn)確性為代價(jià),在 AI 工作負(fù)載中呈現(xiàn)更高的整體性能。
考慮到單個(gè) Epyc 4 消耗 400W 以上的功率,而 MI250X 的功率預(yù)算約為 600W,可以肯定地假設(shè) MI300A 在功率方面不會(huì)節(jié)儉。我們?cè)?The Next Platform 的同事在這次深入研究中估計(jì),該芯片將在 850W 的功率預(yù)算下提供大約 3 petaFLOPS 的 FP8 性能。這將使該芯片比 Nvidia 的 Grace-Hopper 超級(jí)芯片更省電,但性能有所降低。
MI300A 預(yù)計(jì)只是使用該名稱(chēng)的幾個(gè) SKU 之一,我們希望有一個(gè)只有 GPU 的配置。查看封裝渲染圖,一旦 CCD 和 I/O 芯片被剝離,看起來(lái) AMD 確實(shí)可以在那里安裝額外的兩個(gè) GPU 芯片。
至于插座選項(xiàng),MI300A 看起來(lái)將支持至少 4 個(gè)插座配置。從我們對(duì) El Capitan 的了解來(lái)看,似乎每個(gè)節(jié)點(diǎn)都將配備 4 個(gè) APU。
從市場(chǎng)的角度來(lái)看,沒(méi)有其他人擁有像它這樣的芯片。英特爾的 Falcon Shores XPU 本應(yīng)具有類(lèi)似的 CPU+GPU 配置,但該項(xiàng)目被取消以支持普通 GPU。這使得 Nvidia 的 Grace-Hopper 超級(jí)芯片成為 AMD 的主要競(jìng)爭(zhēng)對(duì)手。
話雖如此,他們是非常不同的「野獸」,MI300A 正在塑造成為一個(gè)合適的 APU,具有直接的芯片到芯片通信和共享內(nèi)存池。Grace-Hopper 的不同之處在于它使用 Nvidia 的 NVLink-C2C 互連將 72 核 Arm 兼容 CPU 處理器與 96GB H100 GPU 粘合在一起。
AMD 將用自己的以云為中心的 CPU 挑戰(zhàn) Ampere
自 2017 年推出首款 Epyc 處理器以來(lái),這些芯片已被云提供商穩(wěn)步采用,將核心密度置于單個(gè)核心性能之上。
多年來(lái),我們看到 AMD 的芯片從 32 核增加到 64 核,最近又增加到 96 核。然而,從 2020 年開(kāi)始,競(jìng)爭(zhēng)對(duì)手出現(xiàn)了,承諾更高的核心數(shù)。Ampere 的 Arm 兼容 Altra 處理器提供了 80 個(gè)內(nèi)核,最終提供了 128 個(gè)內(nèi)核和 192 個(gè)內(nèi)核,目標(biāo)客戶(hù)是云提供商。
算法相當(dāng)簡(jiǎn)單,更多的 CPU 內(nèi)核意味著客戶(hù)可以輕松地將更多的 VM 和容器裝入一個(gè)盒子中。為了應(yīng)對(duì)這一新興市場(chǎng)領(lǐng)域,AMD 透露它正在開(kāi)發(fā)自己的核心優(yōu)化芯片。在 2021 年底的加速數(shù)據(jù)中心活動(dòng)中,AMD 展示了一款名為 Bergamo 的 128 核處理器,該處理器專(zhuān)為云原生工作負(fù)載而設(shè)計(jì)。
我們預(yù)計(jì)這款最初計(jì)劃于今年年初推出的芯片將成為 AMD 在 6 月活動(dòng)中發(fā)布的重要產(chǎn)品之一。
Bergamo 將推出一種名為 Zen 4c 的 AMD Zen 4 內(nèi)核的新變體。我們還知道 Bergamo 將采用與 Epyc 4 Genoa 不同的核心配置。據(jù)我們了解,Bergamo 將采用 8 個(gè) 16 核 CCD 來(lái)實(shí)現(xiàn)其 128 核目標(biāo),而不是 12 個(gè) 8 核 CCD。
這種更密集的核心排列告訴我們,與在 Genoa 系列發(fā)現(xiàn)的 Zen 4 核心相比,Zen 4c 核心可能會(huì)被削減。如果猜測(cè)的話,AMD 可能正在縮小已經(jīng)很大的 L3 緩存——每個(gè) CCD 在 Genoa 上有 32MB——為額外的內(nèi)核騰出空間。盡管這是一個(gè)猜測(cè),但 AMD 可能已經(jīng)為云客戶(hù)剝離了低效用的附加功能。
我們也不太了解芯片的新 Zen 4c 內(nèi)核可以期待什么樣的性能,但我們可以做出一些有根據(jù)的猜測(cè)。如果 AMD 效仿 Ampere 的例子,我們可以期望 Bergamo 優(yōu)先考慮一致的時(shí)鐘速度而不是提升頻率。換句話說(shuō),相對(duì)較高的基本時(shí)鐘,但就升壓時(shí)鐘而言并不多。
我們還懷疑 AMD 將保持與我們?cè)?Epyc 4 中看到的類(lèi)似的芯片熱設(shè)計(jì)功率 (TDP) 目標(biāo),將其置于 360W-400W 范圍內(nèi)。由于芯片的核心數(shù)量更多,僅此一項(xiàng)就需要比以前的 Epyc 部件更保守的頻率縮放。
Bergamo 與 Ampere 的云原生芯片的不同之處之一是支持同步多線程。單個(gè) Bergamo 芯片將擁有 128 個(gè)內(nèi)核和 256 個(gè)線程。除了多線程之外,值得記住的是這些 AMD 核心仍然是 x86-64。這意味著如果您的應(yīng)用程序今天在 Epyc 或 Xeon 上運(yùn)行,它應(yīng)該可以毫無(wú)問(wèn)題地在 Bergamo 上運(yùn)行。
盡管 Arm 付出了相當(dāng)大的努力來(lái)驗(yàn)證在其指令集上運(yùn)行的系統(tǒng)和云實(shí)例,但 Ampere Altra 或 AWS 的 Graviton 并不總是如此。將工作負(fù)載遷移到這些芯片并不總是必然的。
盡管如此,AMD 在這方面不會(huì)有先發(fā)優(yōu)勢(shì),過(guò)去幾年,云優(yōu)化芯片市場(chǎng)變得相當(dāng)火爆,Bergamo 不僅要與 Ampere 最新一代的 Arm CPU 抗衡,而且不久之后還要與英特爾的核心優(yōu)化部件抗衡。
Ampere 最近展示了其 AmpereOne 系列芯片,該系列芯片最高可達(dá) 192 個(gè)內(nèi)核,與此同時(shí),英特爾已承諾在 2024 上半年推出名為 Sierra Forest 的 144 核至強(qiáng)處理器。因此,盡管 AMD 可能會(huì)在市場(chǎng)上擊敗英特爾,但它不會(huì)在核心方面領(lǐng)先于其長(zhǎng)期競(jìng)爭(zhēng)對(duì)手。
Genoa-X
Bergamo 并不是我們期望在 AMD 的 6 月活動(dòng)中看到的唯一芯片,預(yù)計(jì)該公司還將推出代號(hào)為 Genoa-X 的第二代處理器。
這些芯片專(zhuān)為各種技術(shù)計(jì)算應(yīng)用而設(shè)計(jì),例如計(jì)算流體動(dòng)力學(xué)、數(shù)據(jù)庫(kù)和其它帶寬密集型工作負(fù)載。
隨著 Milan-X 的發(fā)布,這些芯片于 2021 年推出,采用先進(jìn)的封裝技術(shù),可在芯片的 CCD 上疊加額外的 SRAM。使用這種方法,AMD 能夠在每個(gè)芯片上封裝額外的 64MB 的 L3 緩存,從而在其頂級(jí)芯片上總共包含 768MB 的 L3。
正如去年 6 月報(bào)道的那樣,Genoa-X 會(huì)將每個(gè)插槽的 L3 容量提高到 1GB 以上。這是有道理的,因?yàn)?Genoa 比 Milan 系列多了 4 個(gè) CCD,但這也表明 AMD 這次沒(méi)有做任何特別的事情。
在 AMD 的 96 核 Genoa-X 芯片上,每個(gè) CCD 有 96MB L3 和 12 個(gè) CCD,因此每個(gè)插槽有 1152MB L3 緩存。
然而,正如網(wǎng)站 The Next Platform 所發(fā)現(xiàn)的那樣,與這些芯片相關(guān)的更高價(jià)格并不總是與其性能相匹配。盡管如此,AMD 之前已經(jīng)在某些工作負(fù)載中展示了顯著的性能提升,例如 Synopsys 的 VCS 測(cè)試。
更多精彩即將到來(lái)
AMD 的 6 月活動(dòng)即將成為一場(chǎng)盛宴,值得注意的是,今年至少還有一個(gè) CPU 發(fā)布:Siena。
雖然我們對(duì) Siena 了解不多,但 AMD 表示該產(chǎn)品面向邊緣和電信市場(chǎng),優(yōu)先考慮每瓦性能,并將配備多達(dá) 64 個(gè)內(nèi)核。
正如之前報(bào)道的那樣,英特爾對(duì)邊緣市場(chǎng)擁有巨大的影響力,其中絕大多數(shù)「邊緣」系統(tǒng)都運(yùn)行 Xeon 處理器。然而,我們必須等到 2023 下半年才能看到 AMD 在該領(lǐng)域的競(jìng)爭(zhēng)者到底有多引人注目。
評(píng)論