博客專欄

EEPW首頁 > 博客 > 英偉達(dá)史詩級暴漲后再放大招!推E級AI超算,黃仁勛狂捧生成式AI

英偉達(dá)史詩級暴漲后再放大招!推E級AI超算,黃仁勛狂捧生成式AI

發(fā)布人:芯東西 時間:2023-05-30 來源:工程師 發(fā)布文章

6月13日,GTIC 2023全球汽車芯片創(chuàng)新峰會將在上海國際低碳智慧出行展覽會同期舉辦,首批演講嘉賓已揭曉,歡迎報名。

圖片

圖片

黃仁勛臺北激情演講2小時:連甩7項重磅發(fā)布,想讓全球企業(yè)都用上生成式AI。作者 |  ZeR0
編輯 |  漠影
芯東西5月29日消息,繼上周遠(yuǎn)超預(yù)期的財報業(yè)績預(yù)測引得股價和市值史詩級暴漲后,今日,英偉達(dá)(NVIDIA)創(chuàng)始人兼CEO黃仁勛穿著標(biāo)志性的皮衣,意氣風(fēng)發(fā)地出現(xiàn)在臺北電腦展COMPUTEX 2023上,在主題演講期間先是現(xiàn)場給自家顯卡帶貨,然后一連公布涉及加速計算和人工智能(AI)的多項進(jìn)展。


面向生成式AI歷史性浪潮,英偉達(dá)的一系列發(fā)布包括:推出大內(nèi)存生成式AI超級計算機(jī)DGX GH200,可加速生成式AI設(shè)計的Grace Hopper超級芯片GH200已全面投產(chǎn),推出全新加速以太網(wǎng)平臺Spectrum-X,為游戲提供定制化AI模型代工服務(wù),與全球最大的營銷服務(wù)機(jī)構(gòu)WPP合作打造生成式AI內(nèi)容引擎,多家世界頂級電子制造商采用英偉達(dá)生成式AI工具與Omniverse平臺構(gòu)建先進(jìn)的數(shù)字工廠。

圖片

英偉達(dá)還發(fā)布了MGX服務(wù)器規(guī)范,為系統(tǒng)制造商提供快速高效構(gòu)建100多種服務(wù)器配置的模塊化參考架構(gòu)。黃仁勛說,有超過1600家生成式AI公司采用了英偉達(dá)技術(shù)。

圖片

目前,英偉達(dá)最新市值為9632億美元,離“萬億市值俱樂部會員”只差臨門一腳。一旦突破萬億大關(guān),英偉達(dá)將成為美股市值第五大公司、第七家市值越過1萬億美元的美國上市公司,以及第一家由華人創(chuàng)立的萬億美元市值公司。

圖片


01.生成式AI超算堪比“巨型GPU”:E級算力,谷歌云、Meta、微軟首批試用


首先來看下英偉達(dá)今日推出的采用英偉達(dá)最新GPU和CPU的系統(tǒng)巔峰之作——新型大內(nèi)存AI超級計算機(jī)DGX GH200。


這臺超算預(yù)計今年年底問世,旨在為生成式AI語言應(yīng)用、推薦系統(tǒng)、數(shù)據(jù)分析工作負(fù)載開發(fā)大型下一代模型。黃仁勛認(rèn)為,生成式AI、大型語言模型和推薦系統(tǒng)是現(xiàn)代經(jīng)濟(jì)的數(shù)字引擎。據(jù)他介紹,DGX GH200 AI超級計算機(jī)集成了英偉達(dá)最先進(jìn)的加速計算和網(wǎng)絡(luò)技術(shù)。

圖片

DGX GH200是首款將Grace Hopper超級芯片與英偉達(dá)NVLink Switch系統(tǒng)搭配的超級計算機(jī),通過采用新互連方式,將256個Grace Hopper超級芯片連接在一起,使它們能像單個巨型GPU一樣協(xié)同運(yùn)行,從而提供了1EFLOPS的性能和144TB的共享內(nèi)存,比2020年推出的上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍


谷歌云、Meta、微軟等是首批獲得DGX GH200訪問權(quán)限、用于生成式AI工作負(fù)載的公司。英偉達(dá)也打算將DGX GH200設(shè)計藍(lán)圖提供給云服務(wù)商及其他超大規(guī)模計算廠商,以便他們可以進(jìn)一步為其基礎(chǔ)設(shè)施定制DGX GH200。


此外,英偉達(dá)正在打造自己的基于DGX GH200的大型AI超級計算機(jī)NVIDIA Helios,以支持其研究和開發(fā)團(tuán)隊的工作。它采用4個DGX GH200系統(tǒng),每個都將與英偉達(dá)Quantum-2 InfiniBand網(wǎng)絡(luò)連接,帶寬高達(dá)400Gb/s,以提高訓(xùn)練大型AI模型的數(shù)據(jù)吞吐量。Helios將包括1024顆Grace Hopper超級芯片,將于今年年底上線。DGX GH200超級計算機(jī)包含英偉達(dá)軟件,可為AI和數(shù)據(jù)分析工作負(fù)載提供全套解決方案。英偉達(dá)Base Command軟件提供AI工作流管理、企業(yè)級集群管理、加速計算、存儲和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的庫,以及為運(yùn)行AI工作負(fù)載而優(yōu)化的系統(tǒng)軟件。英偉達(dá)AI平臺的軟件層AI Enterprise提供了100多個框架、預(yù)訓(xùn)練模型和開發(fā)工具,以簡化AI生產(chǎn)的開發(fā)和部署。



02.生成式AI的引擎:GH200 Grace Hopper超級芯片全面投產(chǎn)


英偉達(dá)宣布,GH200 Grace Hopper超級芯片已全面投產(chǎn),將為運(yùn)行復(fù)雜的AI和高性能計算工作負(fù)載提供動力。


基于GH200的系統(tǒng)加入了全球系統(tǒng)制造商基于英偉達(dá)最新Grace、Hopper、Ada Lovelace架構(gòu)的400多個系統(tǒng)配置。GH200 Grace Hopper超級芯片采用NVIDIA NVLink-C2C互連技術(shù),將基于Arm的英偉達(dá)Grace CPU和Hopper GPU架構(gòu)組合在同一封裝中,提供了高達(dá)900GB/s的總帶寬——比傳統(tǒng)加速系統(tǒng)中的標(biāo)準(zhǔn)PCIe Gen5通道帶寬高7倍,互連功耗降低到原來的1/5,能夠滿足苛刻的生成式AI和高性能計算(HPC)應(yīng)用。


位于歐美的幾家全球超大規(guī)模計算企業(yè)和超算中心客戶將可使用GH200驅(qū)動的系統(tǒng)。采用GH200的系統(tǒng)預(yù)計將于今年晚些時候上市。



03.推出新型加速以太網(wǎng)平臺正打造數(shù)億美元生成式AI超算


黃仁勛還宣布推出NVIDIA Spectrum-X,這是一個旨在提高基于以太網(wǎng)的AI云的性能和效率的網(wǎng)絡(luò)平臺。

圖片

它基于網(wǎng)絡(luò)創(chuàng)新,將英偉達(dá)Spectrum-4以太網(wǎng)交換機(jī)與英偉達(dá)BlueField-3 DPU緊密耦合,實(shí)現(xiàn)了相比傳統(tǒng)以太網(wǎng)結(jié)構(gòu)1.7倍的整體AI性能和能效提升,并通過性能隔離增強(qiáng)了多租戶功能,在多租戶環(huán)境中保持一致、可預(yù)測的性能。

圖片

Spectrum-X具有高度通用性,可用于各種AI應(yīng)用。它使用完全基于標(biāo)準(zhǔn)的以太網(wǎng),并可與基于以太網(wǎng)的堆?;ゲ僮?。該網(wǎng)絡(luò)平臺由英偉達(dá)加速軟件和軟件開發(fā)工具包(SDK)進(jìn)行增強(qiáng),支持開發(fā)者構(gòu)建軟件定義的云原生AI應(yīng)用程序。端到端功能的交付減少了大規(guī)?;赥ransformer的生成式AI模型的運(yùn)行時間。該平臺支持256個200Gb/s端口,通過單個交換機(jī)連接,或在兩層leaf-spine拓?fù)渲刑峁?6000個端口,以支持AI云的增長和擴(kuò)展,同時保持高水平的性能并最大限度地減少網(wǎng)絡(luò)延遲。


全球領(lǐng)先的云計算提供商正在采用Spectrum-X平臺擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。


作為Spectrum-X參考設(shè)計的藍(lán)圖和測試平臺,英偉達(dá)正在其以色列數(shù)據(jù)中心構(gòu)建一臺超大規(guī)模生成式AI超級計算機(jī)Israel-1這臺AI超算價值數(shù)億美元,將采用戴爾PowerEdge XE9680服務(wù)器、英偉達(dá)HGX H100超級計算平臺、內(nèi)置BlueField-3 DPU和Spectrum-4交換機(jī)的Spectrum-X平臺。



04.發(fā)布MGX服務(wù)器規(guī)范提供模塊化參考架構(gòu)


為了滿足各種規(guī)模的數(shù)據(jù)中心的需求,黃仁勛發(fā)布了NVIDIA MGX服務(wù)器規(guī)范,為系統(tǒng)制造商提供了模塊化參考架構(gòu)。系統(tǒng)制造商可使用它快速且經(jīng)濟(jì)高效地構(gòu)建100多種服務(wù)器配置,以適應(yīng)廣泛的AI、HPC及NVIDIA Omniverse應(yīng)用。


MGX支持英偉達(dá)全系列GPU、CPU、DPU和網(wǎng)絡(luò)適配器,以及各種x86及Arm處理器。其模塊化設(shè)計使系統(tǒng)制造商能夠更有效地滿足每個客戶的獨(dú)特預(yù)算、電力輸送、熱設(shè)計和機(jī)械要求。


永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將采用MGX構(gòu)建下一代加速計算機(jī),可將開發(fā)成本削減多達(dá)3/4,并將開發(fā)時間縮短2/3至僅需6個月。有了MGX,制造商可以從為其服務(wù)器機(jī)箱加速計算優(yōu)化的基本系統(tǒng)架構(gòu)開始,然后選擇GPU、DPU和CPU。AI訓(xùn)練和5G等多項任務(wù)可以在一臺機(jī)器上處理,升級到下一代硬件也很方便。MGX還能輕松集成到云和企業(yè)數(shù)據(jù)中心中。不同于英偉達(dá)HGX,MGX提供了與英偉達(dá)產(chǎn)品靈活的多代兼容性,以確保系統(tǒng)構(gòu)建者可以重用現(xiàn)有設(shè)計并輕松采用下一代產(chǎn)品。同樣MGX也提供英偉達(dá)完整軟件堆棧的支持。QCT和超微將率先進(jìn)入市場,MGX的設(shè)計將于8月面世。超微今日公布的ARS-221GL-NR系統(tǒng)將采用Grace CPU,而QCT的S74G-2U系統(tǒng)將采用Grace Hopper。黃仁勛還宣布,英偉達(dá)與日本電信巨頭軟銀合作,在日本建立一個分布式數(shù)據(jù)中心網(wǎng)絡(luò)。它將在一個共同的云平臺上提供5G服務(wù)和生成式AI應(yīng)用。

圖片

數(shù)據(jù)中心將在模塊化MGX系統(tǒng)中使用Grace Hopper、BlueField-3 DPU以及Spectrum以太網(wǎng)交換機(jī),以提供5G協(xié)議所需的高精度定時。該平臺將通過提高頻譜效率來降低成本,同時降低能耗。這些系統(tǒng)有助于探索自動駕駛、AI工廠、AR/VR、計算機(jī)視覺和數(shù)字孿生等領(lǐng)域的應(yīng)用。未來的用途可能包括3D視頻會議和全息通信。
05.ACE代工服務(wù):用生成式AI激活游戲角色生命,支持云端及PC低成本部署


生成式AI將改變玩家與游戲角色間的互動方式,并極大提高游戲的沉浸感。對此,黃仁勛宣布推出面向游戲的NVIDIA Avatar云引擎(ACE)。


這是一項定制AI模型代工服務(wù),中間件、工具和游戲開發(fā)者可以使用它來構(gòu)建和部署定制的語音、對話和動畫AI模型。它能賦予非玩家角色(NPC)更智能且不斷進(jìn)化的對話技能,使其能夠以栩栩如生的個性來回答玩家的問題。基于英偉達(dá)Omniverse,ACE for Games為語音、對話和角色動畫提供了優(yōu)化的AI基礎(chǔ)模型,包括:英偉達(dá)NeMo,使用專有數(shù)據(jù),構(gòu)建、定制和部署語言模型;英偉達(dá)Riva,用于自動語音識別和文本轉(zhuǎn)語音,以實(shí)現(xiàn)實(shí)時語音對話;英偉達(dá)Omniverse Audio2Face,用于即時創(chuàng)建游戲角色的表情動畫,以匹配任何語音軌道。開發(fā)人員可以集成整個NVIDIA ACE for Games解決方案,也可以只使用他們需要的組件。英偉達(dá)與專注于為虛擬游戲世界開發(fā)先進(jìn)對話AI的英偉達(dá)Inception初創(chuàng)公司Convai合作,展示了如何快速用英偉達(dá)ACE for Games來構(gòu)建游戲NPU。在一款名為Kairos的演示中,玩家與拉面店的供應(yīng)商Jin互動。基于生成式AI,Jin雖是個NPC,卻能擬真地回答自然語言問題,且回答內(nèi)容與敘述的背景故事一致。它是在虛幻引擎5中使用最新光線追蹤功能和英偉達(dá)DLSS渲染的。


支持英偉達(dá)ACE for Games的神經(jīng)網(wǎng)絡(luò)針對不同的功能進(jìn)行了優(yōu)化,有不同的大小、性能和質(zhì)量折中。ACE for Games代工服務(wù)將幫助開發(fā)者為其游戲重新調(diào)整模型,然后通過英偉達(dá)DGX Cloud、GeForce RTX PC或本地部署進(jìn)行實(shí)時推理。這些模型針對延遲進(jìn)行了優(yōu)化,有助于優(yōu)化游戲的沉浸式交互體驗(yàn)。多家游戲開發(fā)商和初創(chuàng)公司已采用英偉達(dá)的生成式AI技術(shù)。黃仁勛還介紹了英偉達(dá)和微軟如何在生成式AI時代合作推動Windows PC的創(chuàng)新。新的和增強(qiáng)的工具、框架和驅(qū)動程序使PC開發(fā)者更容易開發(fā)和部署AI。例如,用于優(yōu)化和部署GPU加速AI模型和新圖形驅(qū)動程序的微軟Olive工具鏈將提高帶有英偉達(dá)GPU的Windows PC上的DirectML性能。此次合作將增強(qiáng)和擴(kuò)展搭載RTX GPU的1億臺PC的安裝基礎(chǔ),可提升400多個AI加速的Windows應(yīng)用程序和游戲的性能。
06.英偉達(dá)與WPP合作為數(shù)字廣告打造生成式AI內(nèi)容引擎


生成式AI也正為價值7000億美元的數(shù)字廣告行業(yè)帶來了新機(jī)遇?;贜VIDIA AI和Omniverse的突破性引擎將來自領(lǐng)先軟件制造商的創(chuàng)意3D和AI工具連接在一起,以大規(guī)模革新品牌內(nèi)容和體驗(yàn)。全球最大的營銷服務(wù)機(jī)構(gòu)英國WPP集團(tuán)正與英偉達(dá)合作,在Omniverse Cloud上構(gòu)建首個生成式AI內(nèi)容引擎,使創(chuàng)意團(tuán)隊能夠更快、更高效、更大規(guī)模地制作高質(zhì)量的商業(yè)內(nèi)容,同時與客戶的品牌保持完全一致。


新引擎連接了3D設(shè)計、制造和創(chuàng)意供應(yīng)鏈工具的生態(tài)系統(tǒng),包括來自Adobe和Getty Images的工具。在演講中,黃仁勛展示了創(chuàng)意團(tuán)隊如何將他們的3D設(shè)計工具連接起來,在Omniverse中構(gòu)建客戶產(chǎn)品的數(shù)字孿生。生成式AI的內(nèi)容經(jīng)過負(fù)責(zé)任的數(shù)據(jù)來源訓(xùn)練,并與英偉達(dá)Picasso一起構(gòu)建,將使其能快速生成虛擬集。然后WPP客戶可使用完整的場景生成大量廣告、視頻和3D體驗(yàn),供全球市場和用戶在任何網(wǎng)絡(luò)設(shè)備上體驗(yàn)。WPP首席執(zhí)行官馬克·里德(Mark Read)說,生成式AI正以驚人的速度改變營銷世界,WPP與英偉達(dá)合作所提供的獨(dú)特競爭優(yōu)勢是當(dāng)今市場上其他客戶無法獲得的,這項新技術(shù)將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式,并鞏固WPP在為世界頂級品牌創(chuàng)造性應(yīng)用AI方面的行業(yè)領(lǐng)導(dǎo)者地位。
07.電子制造商采用生成式AI實(shí)現(xiàn)數(shù)字化的智能工廠


全球電子制造商正在使用一種全新的綜合參考工作流程推進(jìn)其工業(yè)數(shù)字化工作,在廣泛合作伙伴網(wǎng)絡(luò)的支持下,該工作流程結(jié)合了英偉達(dá)用于生成式AI、3D協(xié)作、仿真和自主機(jī)器的技術(shù),可幫助制造商規(guī)劃、構(gòu)建、運(yùn)營和優(yōu)化其工廠。這些技術(shù)包括:英偉達(dá)Omniverse,它連接了頂級計算機(jī)輔助設(shè)計應(yīng)用以及生成式AI的API和前沿框架;用于模擬和測試機(jī)器人的英偉達(dá)Isaac Sim應(yīng)用程序;英偉達(dá)Metropolis視覺AI框架,用于自動光學(xué)檢測。“世界上最大的工業(yè)生產(chǎn)物理產(chǎn)品。先用數(shù)字化構(gòu)建它們可節(jié)省大量成本。”他談道,英偉達(dá)使電子制造商能輕松構(gòu)建和運(yùn)營虛擬工廠,將其制造和檢驗(yàn)工作流程數(shù)字化,并大大提高質(zhì)量和安全,減少代價高昂的最后一刻意外和延誤。黃仁勛現(xiàn)場展示了一個完全數(shù)字化的智能工廠的演示。


富士康工業(yè)互聯(lián)網(wǎng)、宜鼎國際、和碩、廣達(dá)和緯創(chuàng)正在使用新的參考工作流程,以優(yōu)化他們的工作單元和裝配線運(yùn)營,同時降低生產(chǎn)成本,具體用例包括電路板質(zhì)保檢測點(diǎn)自動化、光學(xué)檢測自動化、建設(shè)虛擬工廠、模擬協(xié)作機(jī)器人、構(gòu)建及運(yùn)營數(shù)字孿生等。英偉達(dá)正在與幾家領(lǐng)先的制造工具和服務(wù)提供商合作,構(gòu)建一個全棧、單一的架構(gòu),每個架構(gòu)都適用于每個工作流程級別。在系統(tǒng)層面,英偉達(dá)IGX Orin提供了一個一體化的邊緣AI平臺,將工業(yè)級硬件與企業(yè)級軟件和支持相結(jié)合。IGX滿足邊緣計算獨(dú)特的耐用性和低功耗要求,同時提供開發(fā)和運(yùn)行AI應(yīng)用程序所需的高性能。其制造商合作伙伴們正在開發(fā)IGX驅(qū)動的系統(tǒng),以服務(wù)于工業(yè)和醫(yī)療市場。在平臺層面,Omniverse連接了世界領(lǐng)先的3D、模擬和生成式AI提供商。團(tuán)隊可在他們最喜歡的應(yīng)用程序之間構(gòu)建互操作性,比如來自Adobe、Autodesk和Siemens的應(yīng)用程序。



08.結(jié)語:生成式AI正催生大量加速計算需求


生成式AI等變革性技術(shù)正滲透到消費(fèi)者的生活方式中,并在醫(yī)療、金融、商業(yè)服務(wù)等許多行業(yè)催生新的商機(jī),隨著越來越多企業(yè)加入AI競爭,數(shù)據(jù)中心性能正邁向下一個階段。訓(xùn)練AI大模型是一項資源和時間密集型任務(wù),需要強(qiáng)大、綠色、可擴(kuò)展的基礎(chǔ)設(shè)施,以滿足不斷增長的加速計算能力、減少碳排放、控制成本等多方面的需求。


英偉達(dá)今日發(fā)布的一系列硬件基礎(chǔ)設(shè)施及軟件工具,目的性非常明確地圍繞企業(yè)開發(fā)和部署生成式AI應(yīng)用的核心痛點(diǎn),通過先進(jìn)互連技術(shù)和共享內(nèi)存設(shè)計突破大規(guī)模AI的算力瓶頸,提供更快的計算性能、更高的能效以及加速開發(fā)流程的工具。這將幫助企業(yè)及研究機(jī)構(gòu)節(jié)省大量時間和成本,將生成式AI用于解決科研挑戰(zhàn)、優(yōu)化工作流程和增強(qiáng)商業(yè)競爭力。



*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 英偉達(dá)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉