英偉達(dá)：GPU供應(yīng)問題涉及封裝而非芯片晶圓

作者：tomshardware 時(shí)間：2023-08-07 來源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

Nvidia 副總裁兼 HPC 驅(qū)動(dòng) DGX 系統(tǒng)總經(jīng)理出面澄清了該公司 GPU 容量問題的具體所在。博伊爾表示，問題并非來自英偉達(dá)錯(cuò)誤計(jì)算需求或其制造合作伙伴臺(tái)積電的晶圓產(chǎn)量問題。

本文引用地址：http://m.butianyuan.cn/article/202308/449363.htm

相反，制造足夠的 GPU 來滿足消費(fèi)者和專業(yè)工作負(fù)載（由于人工智能的蓬勃發(fā)展）需求的瓶頸在于隨后的芯片封裝步驟。英偉達(dá)的 H 級(jí) GPU 采用臺(tái)積電的 2.5D 晶圓基片芯片 (CoWoS) 封裝技術(shù)，這是一種多步驟、高精度的工程步驟，其復(fù)雜性降低了可在一個(gè)芯片中組裝的 GPU 數(shù)量。給定的時(shí)間范圍。這可能會(huì)對(duì)供應(yīng)產(chǎn)生不成比例的影響；所需 GPU 數(shù)量與可用 GPU 數(shù)量之間的差異甚至導(dǎo)致埃隆·馬斯克 (Elon Musk) 表示，事實(shí)證明，它們「比藥品更難獲得」。

Charlie Boyle，英偉達(dá) DGX 副總裁兼總經(jīng)理說道：因此，當(dāng)人們使用 GPU 短缺這個(gè)詞時(shí)，他們實(shí)際上是在談?wù)撝靼迳夏承┙M件的短缺或積壓，而不是 GPU 本身。這些東西的全球制造有限……但我們預(yù)測了人們想要什么，以及世界可以建造什么。

在芯片成為可用的 GPU 之前，需要經(jīng)過從芯片設(shè)計(jì)到制造的多個(gè)步驟。其一，芯片設(shè)計(jì)階段的問題可能會(huì)因設(shè)計(jì)疏忽而造成制造瓶頸，從而降低設(shè)計(jì)的良率（良率是指完全蝕刻的晶圓中可用芯片的百分比）。稀土金屬或其他材料（例如最近受到限制的鎵）的缺乏將影響長物流鏈中的其他步驟；材料污染、能源中斷和許多其他因素也會(huì)如此，正如我們多年來已經(jīng)看到的那樣。

但 CoWoS 的瓶頸問題可能比預(yù)想的更嚴(yán)重。臺(tái)積電本身也表示，預(yù)計(jì)需要 1.5 年（以及完成額外晶圓廠和擴(kuò)建現(xiàn)有設(shè)施）才能使封裝工藝積壓恢復(fù)正常。這可能意味著英偉達(dá)將不得不決定什么產(chǎn)品用什么樣的封裝技術(shù)——因?yàn)闆]有足夠的時(shí)間和能力來封裝所有產(chǎn)品。

供應(yīng)問題可能來自臺(tái)積電的封裝，但最終，英偉達(dá)通過其（根據(jù)帕特·基辛格的說法）「令人難以置信的執(zhí)行力」在人工智能領(lǐng)域占據(jù)主導(dǎo)地位。就臺(tái)積電而言，它是少數(shù)擁有功能性高性能封裝技術(shù)的廠商之一，而這種技術(shù)是性能擴(kuò)展的絕對(duì)要求。AI 領(lǐng)域肯定需要更多的競爭，比如 RX 7900 XTX 等 AMD 游戲 GPU 也被認(rèn)為正走向 AI 數(shù)據(jù)中心。

AMD 于 6 月 13 日發(fā)布可用于 ChatGPT 等 AI 模型的 MI300x 芯片，挑戰(zhàn)目前占有 AI 芯片市場超八成份額的英偉達(dá)。

用于生成式 AI 的大型語言模型需要大量的運(yùn)算，因此需要很大的內(nèi)存支持。AMD 于 6 月曾演示了 MI300x 運(yùn)行 400 億參數(shù)的 Falcon 模型，而 OpenAI 的 GPT-3 模型有 1750 億個(gè)參數(shù)。

AMD 公司的這款 MI300x 芯片及其 CDNA 架構(gòu)專為大型語言模型和其他先進(jìn)的 AI 模型而設(shè)，可用于 192GB 內(nèi)存，也就是說能用于更大規(guī)模的人工智能模型，相比之下，英偉達(dá)的 H100 芯片只能支持 120GB 內(nèi)存。

除此以外，蘇姿豐還介紹了使用配置 MI300x 芯片的 AMD Infinity 架構(gòu)平臺(tái)，用于生成式 AI 的推理和訓(xùn)練，可在一個(gè)系統(tǒng)中集合八個(gè) MI300x 加速器。而英偉達(dá)和谷歌（http://GOOG.US）也開發(fā)出類似的系統(tǒng)，可在一個(gè)盒中集合八個(gè)或以上的 GPU 用于 AI 應(yīng)用。

目前眾多大型科技公司都在布局 AI 和大模型，對(duì)這類芯片的需求殷切，AMD 積極加入這個(gè)市場顯然并非僅僅為了一兩個(gè)季度業(yè)績好看，而是為了更長遠(yuǎn)的發(fā)展。

需要注意的是，對(duì)比于其較為成熟的產(chǎn)品，當(dāng)前 AI 應(yīng)用產(chǎn)品的貢獻(xiàn)雖增長強(qiáng)勁，卻占比較小，尚不足以帶來壓倒性的推動(dòng)，在可預(yù)見的將來難以帶來肉眼可見的提升作用，可能要到明年或以后。

而且制造方面也需要競爭。英特爾的代工服務(wù) (IFS) 有望為高性能 GPU 游戲帶來另一位玩家；與此同時(shí)，人們還希望三星至少能夠縮小其相對(duì)于臺(tái)積電的制造技術(shù)差距，從而使其芯片具有足夠的吸引力，吸引另一家制造商參與競爭。三星在封裝方面的投資數(shù)額巨大，但業(yè)界一致認(rèn)為三星在封裝技術(shù)方面落后于臺(tái)積電。三星電子需要一記 "重拳"，才能在封裝領(lǐng)域趕超臺(tái)積電。

臺(tái)積電于 2012 年首次引入 CoWoS 技術(shù)，此后不斷升級(jí)其封裝能力。如今，英偉達(dá)、蘋果和 AMD 的旗艦產(chǎn)品都離不開臺(tái)積電及其先進(jìn)封裝技術(shù)的支持。這也解釋了為什么三星電子在 2022 年領(lǐng)先臺(tái)積電一步完成了 3nm 量產(chǎn)，但英偉達(dá)和蘋果等巨頭仍然希望使用臺(tái)積電的生產(chǎn)線。

為了超越臺(tái)積電的 CoWoS，三星正在開發(fā)更先進(jìn)的 I-cube 和 X-cube 封裝技術(shù)。此外有消息稱，三星將研究重點(diǎn)放在了 3D 封裝上，將多個(gè)芯片垂直堆疊以提高性能。一位半導(dǎo)體業(yè)內(nèi)人士表示：「很快三星和臺(tái)積電在封裝上就會(huì)發(fā)生正面沖突?！?/p>

新聞中心

英偉達(dá)：GPU供應(yīng)問題涉及封裝而非芯片晶圓

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)