AMD 正式出擊,推出最新AI芯片挑戰(zhàn)英偉達
盡管近段時間,英偉達在 AI 領(lǐng)域嶄露頭角,但 AMD 今日的發(fā)布,勢必要在算力芯片領(lǐng)域掀起一場「腥風血雨」。
本文引用地址:http://m.butianyuan.cn/article/202306/447698.htm今天,AMD 數(shù)據(jù)中心和人工智能首映式上,推出了針對云和技術(shù)應(yīng)用程序的 Epyc 處理器,以及其 Instinct MI300 系列加速器的詳細計劃。
首先是新一代的 Epyc 處理器,Bergamo 是針對云原生應(yīng)用的產(chǎn)品線,也是第一款使用 Zen 4c 架構(gòu)的產(chǎn)品。
其次,AMD 還在活動中展示了其最新的緩存堆疊 X 芯片,代號為 Genoa-X。Genoa-X 與具有相同內(nèi)核數(shù)的 Intel Xeon 的比較,性能提高了 2.2 倍和 2.9 倍。
最后,AMD 宣布新款 GPU 專用的 MI300X AI 加速器,并表示 MI300X 和 8-GPU Instinct 平臺將在第三季度出樣,并在第四季度推出。
在會議開始時,AMD 全球總裁兼 CEO 蘇姿豐表示:「今天,我們在數(shù)據(jù)中心戰(zhàn)略上又向前邁出了重要一步,因為我們擴展了第四代 EPYC 處理器系列,為云和技術(shù)計算工作負載提供了新的領(lǐng)先解決方案,并宣布了與最大的云提供商的新公共實例和內(nèi)部部署?!?/span>
「人工智能是塑造下一代計算的決定性技術(shù),也是 AMD 最大的戰(zhàn)略增長機會。我們專注于加速 AMD AI 平臺在數(shù)據(jù)中心的大規(guī)模部署,計劃于今年晚些時候推出我們的 Instinct MI300 加速器,以及為我們的硬件優(yōu)化的企業(yè)級 AI 軟件生態(tài)系統(tǒng)不斷壯大。」
AMD 再次讓人發(fā)出歡呼:「AMD YES!」
Bergamo
AMD 宣布為數(shù)據(jù)中心推出代號為 Bergamo 的第四代 EPYC(霄龍) 處理器。
Bergamo 是針對云原生應(yīng)用的產(chǎn)品線,也是第一款使用 Zen 4c 架構(gòu)的產(chǎn)品。Bergamo 在架構(gòu)進行精簡,但著重保有與 Zen 4 一脈相承的 x86 架構(gòu),并重新設(shè)計 L3 快取系統(tǒng),相較完整的 Zen 4 架構(gòu)縮減 35% 的裸片面積。
AMD 的 Bergamo Epyc 處理器具有 128 個核心和 256 個線程,分布在八個核心復(fù)合芯片上
同時單一 CCD 具備 16 個 Zen 4c,一顆 Bergamo 最多由 8 個 CCD 構(gòu)成,具備最高 128 核心的特質(zhì),采用臺積電 5nm 制程共有高達 820 億個晶體管。
Bergamo 芯片目前正在向大型云計算客戶「批量出貨」。Meta 就是其客戶之一,Meta 代表與 Lisa Su 一起上臺討論了 Meta 在其基礎(chǔ)架構(gòu)中使用 AMD EPYC 處理器的情況。
Meta 計劃為其基礎(chǔ)架構(gòu)使用 Bergamo,它的性能比上一代 Milan 芯片高出 2.5 倍。Meta 還將使用 Bergamo 作為其存儲平臺。
Genoa-X
AMD 在會議上展示了最新的緩存堆疊 X 芯片,代號為 Genoa-X。Genoa-X 主要針對高性能計算應(yīng)用程序,包括計算流體動力學、電子設(shè)計自動化、有限元分析、地震層析成像和其他帶寬敏感型工作負載。
AMD 于去年 6 月首次透露,Genoa-X 是 AMD 現(xiàn)在強制配備 V-cache 的 EPYC 服務(wù)器 CPU。
AMD 的 Genoa-X CPU 在每個芯片計算芯片上堆疊了 64MB SRAM 塊,總共有 1.1GB 的三級緩存
AMD 正在使用緩存芯片堆疊為其他常規(guī)的 Genoa Zen 4 CCD 添加更多的 L3 緩存,從而為 AMD 提供了一種生產(chǎn)高緩存芯片設(shè)計的新穎方法,而無需實際布置一個完整的獨立芯片。在這種情況下,Genoa/Genoa-X 芯片上有 12 個 CCD,這允許 AMD 向芯片添加 768MB 的額外 L3 緩存。
這種高緩存 SKU 針對的是工作負載的利基細分市場,如上文提到的計算流體動力學、電子設(shè)計自動化等,這些工作負載特別受益于額外的緩存。AMD 表示 Genoa-X 可提供多達 96 個內(nèi)核和總計「1.1GB」的三級緩存。
Genoa-X 與具有相同內(nèi)核數(shù)的 Intel Xeon 的比較,緩存提升意味著在各種計算流體動力學和有限元分析工作負載負載方面的性能提高了 2.2 倍和 2.9 倍。
MI300 正面決戰(zhàn)英偉達 H100
接下來,Lisa Su 開始了今天的重頭戲——Instinct MI300。ADM 表示,AMD Instinct GPU 已經(jīng)為許多世界上最快的超級計算機提供動力。
AMD Instinct MI300 于去年 6 月首次發(fā)布,并在 2023 年國際消費電子展上進行了更深入的詳細介紹,這是 AMD 在 AI 和 HPC 市場的重要一步。
AMD 展示「AMD Instinct MI300 系列加速器」(以下簡稱 Instinct MI300 系列)。有純 GPU「AMD Instinct MI300X 加速器」(以下簡稱 Instinct MI300X)和 APU(CPU+GPU)「AMD Instinct MI300A」(以下簡稱 Instinct MI300A)兩款產(chǎn)品。
首先看來 Instinct MI300X,全新的 MI300X 服務(wù)器 GPU,它是 MI300A APU 的變體。Instinct MI300X 是繼傳統(tǒng) Instinct MI200 系列加速器之后的一款面向數(shù)據(jù)中心的 GPU,采用 CDNA 3,即傳統(tǒng) MI200 系列使用的 GPU 架構(gòu) CDNA 2 的后繼產(chǎn)品。
其將三個 Zen 4 芯片替換為三個 CDNA 3 芯片,并增加了 64GB 的 HBM3,總?cè)萘繛?192GB。與 MI250 相比,提高了 8 倍的性能和 5 倍的效率。
Instinct MI300X 由 12 個不同的小芯片組成,其中包括八個 GPU 和幾個 I/O 芯片,總共有令人驚訝的 1530 億個晶體管。
這款 Instinct MI300X 的一個模塊具有處理 LLM 的「Falcon-40B」400 億參數(shù)的能力。提供了 192GB 的 HBM3、5.2TB/s 的帶寬和 896GB/s 的 Infinity Fabric 帶寬。
MI300X 提供的 HBM 密度是 Nvidia H100 的 2.4 倍,HBM 帶寬是 H100 的 1.6 倍,這意味著 AMD 可以運行比 Nvidia 芯片更大的模型。
Lisa Su 當場對運行 Hugging Face AI 模型的 MI300X 進行了演示,讓寫了一首關(guān)于舊金山的詩。這是第一次在單個 GPU 上運行這么大的模型,單個 MI300X 可以運行一個高達 800 億個參數(shù)的模型。
再來看 Instinct MI300A,Instinct MI300A 是一款數(shù)據(jù)中心 APU,它混合了總共 13 個小芯片,其中許多小芯片是 3D 堆疊的。具有 24 個 Zen 4 CPU 內(nèi)核、融合了 CDNA 3 圖形引擎和 8 個 HBM3 內(nèi)存堆棧的單芯片封裝總計 128GB。
九個計算裸片混合了 5nm CPU 和 GPU,它們以 3D 方式堆疊在四個 6nm 基礎(chǔ)裸片之上,這些裸片是處理內(nèi)存和 I/O 流量以及其他功能的有源中介層。
總體來看,Instinct MI300A 擁有 1460 億個晶體管,是 AMD 投入生產(chǎn)的最大芯片。
此外,Lisa Su 還發(fā)布了 AMD Instinct 平臺,該平臺擁有 8 個采用行業(yè)標準 OCP 設(shè)計的 MI300X,提供總計 1.5TB 的 HBM3 內(nèi)存。
MI300A,CPU+GPU 機型,現(xiàn)已出樣。MI300X 和 8-GPU Instinct 平臺將在第三季度出樣,并在第四季度推出。最先進的人工智能 GPU MI300X 將于今年晚些時候開始向部分客戶發(fā)貨。
AMD Pensando DPU
除此之外,AMD 已經(jīng)公布了「AMD Pensando DPU」。Pensando DPU 是 AMD 在去年(2022 年)5 月宣布完成收購的 Pensando Systems 衍生出來的產(chǎn)品,可以擺脫這種處理,提高整個數(shù)據(jù)中心的 CPU 處理能力??梢哉f,該產(chǎn)品與 NVIDIA 稱為 DPU、Intel 稱為 IPU 的產(chǎn)品具有相同的功能。
此次除了在數(shù)據(jù)中心和 AI 技術(shù)首映會上展示之外,還公開了下一代 DPU 產(chǎn)品「Giglio」(開發(fā)代號,Giglio)的存在。據(jù) AMD 稱,與目前的同類產(chǎn)品相比,它將提供更高的性能和能效,并將于 2023 年底上市。
此外,AMD 宣布將開始向客戶提供 Pensando Software-in-Silicon Developer Kit (Pensando SSDK) 作為 AMD Pensando DPU 的軟件開發(fā)套件。因此,AMD 解釋說,將有可能將使用 Pensando DPU 的網(wǎng)絡(luò)虛擬化和安全功能等功能整合到軟件中。
評論