英偉達(dá)史詩級暴漲后再放大招！推E級AI超算，黃仁勛狂捧生成式AI

發(fā)布人：芯東西時間：2023-05-30 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

6月13日，GTIC 2023全球汽車芯片創(chuàng)新峰會將在上海國際低碳智慧出行展覽會同期舉辦，首批演講嘉賓已揭曉，歡迎報名。

黃仁勛臺北激情演講2小時：連甩7項重磅發(fā)布，想讓全球企業(yè)都用上生成式AI。作者 | ZeR0
編輯 | 漠影
芯東西5月29日消息，繼上周遠(yuǎn)超預(yù)期的財報業(yè)績預(yù)測引得股價和市值史詩級暴漲后，今日，英偉達(dá)（NVIDIA）創(chuàng)始人兼CEO黃仁勛穿著標(biāo)志性的皮衣，意氣風(fēng)發(fā)地出現(xiàn)在臺北電腦展COMPUTEX 2023上，在主題演講期間先是現(xiàn)場給自家顯卡帶貨，然后一連公布涉及加速計算和人工智能（AI）的多項進(jìn)展。

面向生成式AI歷史性浪潮，英偉達(dá)的一系列發(fā)布包括：推出大內(nèi)存生成式AI超級計算機(jī)DGX GH200，可加速生成式AI設(shè)計的Grace Hopper超級芯片GH200已全面投產(chǎn)，推出全新加速以太網(wǎng)平臺Spectrum-X，為游戲提供定制化AI模型代工服務(wù)，與全球最大的營銷服務(wù)機(jī)構(gòu)WPP合作打造生成式AI內(nèi)容引擎，多家世界頂級電子制造商采用英偉達(dá)生成式AI工具與Omniverse平臺構(gòu)建先進(jìn)的數(shù)字工廠。

英偉達(dá)還發(fā)布了MGX服務(wù)器規(guī)范，為系統(tǒng)制造商提供快速高效構(gòu)建100多種服務(wù)器配置的模塊化參考架構(gòu)。黃仁勛說，有超過1600家生成式AI公司采用了英偉達(dá)技術(shù)。

目前，英偉達(dá)最新市值為9632億美元，離“萬億市值俱樂部會員”只差臨門一腳。一旦突破萬億大關(guān)，英偉達(dá)將成為美股市值第五大公司、第七家市值越過1萬億美元的美國上市公司，以及第一家由華人創(chuàng)立的萬億美元市值公司。

01.生成式AI超算堪比“巨型GPU”：E級算力，谷歌云、Meta、微軟首批試用

首先來看下英偉達(dá)今日推出的采用英偉達(dá)最新GPU和CPU的系統(tǒng)巔峰之作——新型大內(nèi)存AI超級計算機(jī)DGX GH200。

這臺超算預(yù)計今年年底問世，旨在為生成式AI語言應(yīng)用、推薦系統(tǒng)、數(shù)據(jù)分析工作負(fù)載開發(fā)大型下一代模型。黃仁勛認(rèn)為，生成式AI、大型語言模型和推薦系統(tǒng)是現(xiàn)代經(jīng)濟(jì)的數(shù)字引擎。據(jù)他介紹，DGX GH200 AI超級計算機(jī)集成了英偉達(dá)最先進(jìn)的加速計算和網(wǎng)絡(luò)技術(shù)。

DGX GH200是首款將Grace Hopper超級芯片與英偉達(dá)NVLink Switch系統(tǒng)搭配的超級計算機(jī)，通過采用新互連方式，將256個Grace Hopper超級芯片連接在一起，使它們能像單個巨型GPU一樣協(xié)同運(yùn)行，從而提供了1EFLOPS的性能和144TB的共享內(nèi)存，比2020年推出的上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍。

谷歌云、Meta、微軟等是首批獲得DGX GH200訪問權(quán)限、用于生成式AI工作負(fù)載的公司。英偉達(dá)也打算將DGX GH200設(shè)計藍(lán)圖提供給云服務(wù)商及其他超大規(guī)模計算廠商，以便他們可以進(jìn)一步為其基礎(chǔ)設(shè)施定制DGX GH200。

此外，英偉達(dá)正在打造自己的基于DGX GH200的大型AI超級計算機(jī)NVIDIA Helios，以支持其研究和開發(fā)團(tuán)隊的工作。它采用4個DGX GH200系統(tǒng)，每個都將與英偉達(dá)Quantum-2 InfiniBand網(wǎng)絡(luò)連接，帶寬高達(dá)400Gb/s，以提高訓(xùn)練大型AI模型的數(shù)據(jù)吞吐量。Helios將包括1024顆Grace Hopper超級芯片，將于今年年底上線。DGX GH200超級計算機(jī)包含英偉達(dá)軟件，可為AI和數(shù)據(jù)分析工作負(fù)載提供全套解決方案。英偉達(dá)Base Command軟件提供AI工作流管理、企業(yè)級集群管理、加速計算、存儲和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的庫，以及為運(yùn)行AI工作負(fù)載而優(yōu)化的系統(tǒng)軟件。英偉達(dá)AI平臺的軟件層AI Enterprise提供了100多個框架、預(yù)訓(xùn)練模型和開發(fā)工具，以簡化AI生產(chǎn)的開發(fā)和部署。

02.生成式AI的引擎：GH200 Grace Hopper超級芯片全面投產(chǎn)

英偉達(dá)宣布，GH200 Grace Hopper超級芯片已全面投產(chǎn)，將為運(yùn)行復(fù)雜的AI和高性能計算工作負(fù)載提供動力。

基于GH200的系統(tǒng)加入了全球系統(tǒng)制造商基于英偉達(dá)最新Grace、Hopper、Ada Lovelace架構(gòu)的400多個系統(tǒng)配置。GH200 Grace Hopper超級芯片采用NVIDIA NVLink-C2C互連技術(shù)，將基于Arm的英偉達(dá)Grace CPU和Hopper GPU架構(gòu)組合在同一封裝中，提供了高達(dá)900GB/s的總帶寬——比傳統(tǒng)加速系統(tǒng)中的標(biāo)準(zhǔn)PCIe Gen5通道帶寬高7倍，互連功耗降低到原來的1/5，能夠滿足苛刻的生成式AI和高性能計算（HPC）應(yīng)用。

位于歐美的幾家全球超大規(guī)模計算企業(yè)和超算中心客戶將可使用GH200驅(qū)動的系統(tǒng)。采用GH200的系統(tǒng)預(yù)計將于今年晚些時候上市。

03.推出新型加速以太網(wǎng)平臺正打造數(shù)億美元生成式AI超算

黃仁勛還宣布推出NVIDIA Spectrum-X，這是一個旨在提高基于以太網(wǎng)的AI云的性能和效率的網(wǎng)絡(luò)平臺。

它基于網(wǎng)絡(luò)創(chuàng)新，將英偉達(dá)Spectrum-4以太網(wǎng)交換機(jī)與英偉達(dá)BlueField-3 DPU緊密耦合，實(shí)現(xiàn)了相比傳統(tǒng)以太網(wǎng)結(jié)構(gòu)1.7倍的整體AI性能和能效提升，并通過性能隔離增強(qiáng)了多租戶功能，在多租戶環(huán)境中保持一致、可預(yù)測的性能。

Spectrum-X具有高度通用性，可用于各種AI應(yīng)用。它使用完全基于標(biāo)準(zhǔn)的以太網(wǎng)，并可與基于以太網(wǎng)的堆?；ゲ僮?。該網(wǎng)絡(luò)平臺由英偉達(dá)加速軟件和軟件開發(fā)工具包（SDK）進(jìn)行增強(qiáng)，支持開發(fā)者構(gòu)建軟件定義的云原生AI應(yīng)用程序。端到端功能的交付減少了大規(guī)?；赥ransformer的生成式AI模型的運(yùn)行時間。該平臺支持256個200Gb/s端口，通過單個交換機(jī)連接，或在兩層leaf-spine拓?fù)渲刑峁?6000個端口，以支持AI云的增長和擴(kuò)展，同時保持高水平的性能并最大限度地減少網(wǎng)絡(luò)延遲。

全球領(lǐng)先的云計算提供商正在采用Spectrum-X平臺擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。

作為Spectrum-X參考設(shè)計的藍(lán)圖和測試平臺，英偉達(dá)正在其以色列數(shù)據(jù)中心構(gòu)建一臺超大規(guī)模生成式AI超級計算機(jī)Israel-1。這臺AI超算價值數(shù)億美元，將采用戴爾PowerEdge XE9680服務(wù)器、英偉達(dá)HGX H100超級計算平臺、內(nèi)置BlueField-3 DPU和Spectrum-4交換機(jī)的Spectrum-X平臺。

04.發(fā)布MGX服務(wù)器規(guī)范提供模塊化參考架構(gòu)

為了滿足各種規(guī)模的數(shù)據(jù)中心的需求，黃仁勛發(fā)布了NVIDIA MGX服務(wù)器規(guī)范，為系統(tǒng)制造商提供了模塊化參考架構(gòu)。系統(tǒng)制造商可使用它快速且經(jīng)濟(jì)高效地構(gòu)建100多種服務(wù)器配置，以適應(yīng)廣泛的AI、HPC及NVIDIA Omniverse應(yīng)用。

MGX支持英偉達(dá)全系列GPU、CPU、DPU和網(wǎng)絡(luò)適配器，以及各種x86及Arm處理器。其模塊化設(shè)計使系統(tǒng)制造商能夠更有效地滿足每個客戶的獨(dú)特預(yù)算、電力輸送、熱設(shè)計和機(jī)械要求。

永擎（ASRock Rack）、華碩（ASUS）、技嘉（GIGABYTE）、和碩（Pegatron）、QCT、超微（Supermicro）等將采用MGX構(gòu)建下一代加速計算機(jī)，可將開發(fā)成本削減多達(dá)3/4，并將開發(fā)時間縮短2/3至僅需6個月。有了MGX，制造商可以從為其服務(wù)器機(jī)箱加速計算優(yōu)化的基本系統(tǒng)架構(gòu)開始，然后選擇GPU、DPU和CPU。AI訓(xùn)練和5G等多項任務(wù)可以在一臺機(jī)器上處理，升級到下一代硬件也很方便。MGX還能輕松集成到云和企業(yè)數(shù)據(jù)中心中。不同于英偉達(dá)HGX，MGX提供了與英偉達(dá)產(chǎn)品靈活的多代兼容性，以確保系統(tǒng)構(gòu)建者可以重用現(xiàn)有設(shè)計并輕松采用下一代產(chǎn)品。同樣MGX也提供英偉達(dá)完整軟件堆棧的支持。QCT和超微將率先進(jìn)入市場，MGX的設(shè)計將于8月面世。超微今日公布的ARS-221GL-NR系統(tǒng)將采用Grace CPU，而QCT的S74G-2U系統(tǒng)將采用Grace Hopper。黃仁勛還宣布，英偉達(dá)與日本電信巨頭軟銀合作，在日本建立一個分布式數(shù)據(jù)中心網(wǎng)絡(luò)。它將在一個共同的云平臺上提供5G服務(wù)和生成式AI應(yīng)用。

數(shù)據(jù)中心將在模塊化MGX系統(tǒng)中使用Grace Hopper、BlueField-3 DPU以及Spectrum以太網(wǎng)交換機(jī)，以提供5G協(xié)議所需的高精度定時。該平臺將通過提高頻譜效率來降低成本，同時降低能耗。這些系統(tǒng)有助于探索自動駕駛、AI工廠、AR/VR、計算機(jī)視覺和數(shù)字孿生等領(lǐng)域的應(yīng)用。未來的用途可能包括3D視頻會議和全息通信。
05.ACE代工服務(wù)：用生成式AI激活游戲角色生命，支持云端及PC低成本部署

生成式AI將改變玩家與游戲角色間的互動方式，并極大提高游戲的沉浸感。對此，黃仁勛宣布推出面向游戲的NVIDIA Avatar云引擎（ACE）。

這是一項定制AI模型代工服務(wù)，中間件、工具和游戲開發(fā)者可以使用它來構(gòu)建和部署定制的語音、對話和動畫AI模型。它能賦予非玩家角色（NPC）更智能且不斷進(jìn)化的對話技能，使其能夠以栩栩如生的個性來回答玩家的問題。基于英偉達(dá)Omniverse，ACE for Games為語音、對話和角色動畫提供了優(yōu)化的AI基礎(chǔ)模型，包括：英偉達(dá)NeMo，使用專有數(shù)據(jù)，構(gòu)建、定制和部署語言模型；英偉達(dá)Riva，用于自動語音識別和文本轉(zhuǎn)語音，以實(shí)現(xiàn)實(shí)時語音對話；英偉達(dá)Omniverse Audio2Face，用于即時創(chuàng)建游戲角色的表情動畫，以匹配任何語音軌道。開發(fā)人員可以集成整個NVIDIA ACE for Games解決方案，也可以只使用他們需要的組件。英偉達(dá)與專注于為虛擬游戲世界開發(fā)先進(jìn)對話AI的英偉達(dá)Inception初創(chuàng)公司Convai合作，展示了如何快速用英偉達(dá)ACE for Games來構(gòu)建游戲NPU。在一款名為Kairos的演示中，玩家與拉面店的供應(yīng)商Jin互動。基于生成式AI，Jin雖是個NPC，卻能擬真地回答自然語言問題，且回答內(nèi)容與敘述的背景故事一致。它是在虛幻引擎5中使用最新光線追蹤功能和英偉達(dá)DLSS渲染的。

支持英偉達(dá)ACE for Games的神經(jīng)網(wǎng)絡(luò)針對不同的功能進(jìn)行了優(yōu)化，有不同的大小、性能和質(zhì)量折中。ACE for Games代工服務(wù)將幫助開發(fā)者為其游戲重新調(diào)整模型，然后通過英偉達(dá)DGX Cloud、GeForce RTX PC或本地部署進(jìn)行實(shí)時推理。這些模型針對延遲進(jìn)行了優(yōu)化，有助于優(yōu)化游戲的沉浸式交互體驗(yàn)。多家游戲開發(fā)商和初創(chuàng)公司已采用英偉達(dá)的生成式AI技術(shù)。黃仁勛還介紹了英偉達(dá)和微軟如何在生成式AI時代合作推動Windows PC的創(chuàng)新。新的和增強(qiáng)的工具、框架和驅(qū)動程序使PC開發(fā)者更容易開發(fā)和部署AI。例如，用于優(yōu)化和部署GPU加速AI模型和新圖形驅(qū)動程序的微軟Olive工具鏈將提高帶有英偉達(dá)GPU的Windows PC上的DirectML性能。此次合作將增強(qiáng)和擴(kuò)展搭載RTX GPU的1億臺PC的安裝基礎(chǔ)，可提升400多個AI加速的Windows應(yīng)用程序和游戲的性能。
06.英偉達(dá)與WPP合作為數(shù)字廣告打造生成式AI內(nèi)容引擎

生成式AI也正為價值7000億美元的數(shù)字廣告行業(yè)帶來了新機(jī)遇?；贜VIDIA AI和Omniverse的突破性引擎將來自領(lǐng)先軟件制造商的創(chuàng)意3D和AI工具連接在一起，以大規(guī)模革新品牌內(nèi)容和體驗(yàn)。全球最大的營銷服務(wù)機(jī)構(gòu)英國WPP集團(tuán)正與英偉達(dá)合作，在Omniverse Cloud上構(gòu)建首個生成式AI內(nèi)容引擎，使創(chuàng)意團(tuán)隊能夠更快、更高效、更大規(guī)模地制作高質(zhì)量的商業(yè)內(nèi)容，同時與客戶的品牌保持完全一致。

新引擎連接了3D設(shè)計、制造和創(chuàng)意供應(yīng)鏈工具的生態(tài)系統(tǒng)，包括來自Adobe和Getty Images的工具。在演講中，黃仁勛展示了創(chuàng)意團(tuán)隊如何將他們的3D設(shè)計工具連接起來，在Omniverse中構(gòu)建客戶產(chǎn)品的數(shù)字孿生。生成式AI的內(nèi)容經(jīng)過負(fù)責(zé)任的數(shù)據(jù)來源訓(xùn)練，并與英偉達(dá)Picasso一起構(gòu)建，將使其能快速生成虛擬集。然后WPP客戶可使用完整的場景生成大量廣告、視頻和3D體驗(yàn)，供全球市場和用戶在任何網(wǎng)絡(luò)設(shè)備上體驗(yàn)。WPP首席執(zhí)行官馬克·里德（Mark Read）說，生成式AI正以驚人的速度改變營銷世界，WPP與英偉達(dá)合作所提供的獨(dú)特競爭優(yōu)勢是當(dāng)今市場上其他客戶無法獲得的，這項新技術(shù)將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式，并鞏固WPP在為世界頂級品牌創(chuàng)造性應(yīng)用AI方面的行業(yè)領(lǐng)導(dǎo)者地位。
07.電子制造商采用生成式AI實(shí)現(xiàn)數(shù)字化的智能工廠

全球電子制造商正在使用一種全新的綜合參考工作流程推進(jìn)其工業(yè)數(shù)字化工作，在廣泛合作伙伴網(wǎng)絡(luò)的支持下，該工作流程結(jié)合了英偉達(dá)用于生成式AI、3D協(xié)作、仿真和自主機(jī)器的技術(shù)，可幫助制造商規(guī)劃、構(gòu)建、運(yùn)營和優(yōu)化其工廠。這些技術(shù)包括：英偉達(dá)Omniverse，它連接了頂級計算機(jī)輔助設(shè)計應(yīng)用以及生成式AI的API和前沿框架；用于模擬和測試機(jī)器人的英偉達(dá)Isaac Sim應(yīng)用程序；英偉達(dá)Metropolis視覺AI框架，用于自動光學(xué)檢測。“世界上最大的工業(yè)生產(chǎn)物理產(chǎn)品。先用數(shù)字化構(gòu)建它們可節(jié)省大量成本。”他談道，英偉達(dá)使電子制造商能輕松構(gòu)建和運(yùn)營虛擬工廠，將其制造和檢驗(yàn)工作流程數(shù)字化，并大大提高質(zhì)量和安全，減少代價高昂的最后一刻意外和延誤。黃仁勛現(xiàn)場展示了一個完全數(shù)字化的智能工廠的演示。

富士康工業(yè)互聯(lián)網(wǎng)、宜鼎國際、和碩、廣達(dá)和緯創(chuàng)正在使用新的參考工作流程，以優(yōu)化他們的工作單元和裝配線運(yùn)營，同時降低生產(chǎn)成本，具體用例包括電路板質(zhì)保檢測點(diǎn)自動化、光學(xué)檢測自動化、建設(shè)虛擬工廠、模擬協(xié)作機(jī)器人、構(gòu)建及運(yùn)營數(shù)字孿生等。英偉達(dá)正在與幾家領(lǐng)先的制造工具和服務(wù)提供商合作，構(gòu)建一個全棧、單一的架構(gòu)，每個架構(gòu)都適用于每個工作流程級別。在系統(tǒng)層面，英偉達(dá)IGX Orin提供了一個一體化的邊緣AI平臺，將工業(yè)級硬件與企業(yè)級軟件和支持相結(jié)合。IGX滿足邊緣計算獨(dú)特的耐用性和低功耗要求，同時提供開發(fā)和運(yùn)行AI應(yīng)用程序所需的高性能。其制造商合作伙伴們正在開發(fā)IGX驅(qū)動的系統(tǒng)，以服務(wù)于工業(yè)和醫(yī)療市場。在平臺層面，Omniverse連接了世界領(lǐng)先的3D、模擬和生成式AI提供商。團(tuán)隊可在他們最喜歡的應(yīng)用程序之間構(gòu)建互操作性，比如來自Adobe、Autodesk和Siemens的應(yīng)用程序。

08.結(jié)語：生成式AI正催生大量加速計算需求

生成式AI等變革性技術(shù)正滲透到消費(fèi)者的生活方式中，并在醫(yī)療、金融、商業(yè)服務(wù)等許多行業(yè)催生新的商機(jī)，隨著越來越多企業(yè)加入AI競爭，數(shù)據(jù)中心性能正邁向下一個階段。訓(xùn)練AI大模型是一項資源和時間密集型任務(wù)，需要強(qiáng)大、綠色、可擴(kuò)展的基礎(chǔ)設(shè)施，以滿足不斷增長的加速計算能力、減少碳排放、控制成本等多方面的需求。

英偉達(dá)今日發(fā)布的一系列硬件基礎(chǔ)設(shè)施及軟件工具，目的性非常明確地圍繞企業(yè)開發(fā)和部署生成式AI應(yīng)用的核心痛點(diǎn)，通過先進(jìn)互連技術(shù)和共享內(nèi)存設(shè)計突破大規(guī)模AI的算力瓶頸，提供更快的計算性能、更高的能效以及加速開發(fā)流程的工具。這將幫助企業(yè)及研究機(jī)構(gòu)節(jié)省大量時間和成本，將生成式AI用于解決科研挑戰(zhàn)、優(yōu)化工作流程和增強(qiáng)商業(yè)競爭力。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

英偉達(dá)史詩級暴漲后再放大招！推E級AI超算，黃仁勛狂捧生成式AI

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

英偉達(dá)史詩級暴漲后再放大招！推E級AI超算，黃仁勛狂捧生成式AI

相關(guān)推薦

技術(shù)專區(qū)

英偉達(dá)史詩級暴漲后再放大招！推E級AI超算，黃仁勛狂捧生成式AI