四篇技術(shù)論文，英特爾在Hot Chips 2024大會(huì)上展示AI架構(gòu)新進(jìn)展

—— 英特爾至強(qiáng) 6系統(tǒng)集成芯片和Lunar Lake處理器，以及英特爾? Gaudi 3 AI加速器和OCI（光學(xué)計(jì)算互連）技術(shù)，領(lǐng)銜大會(huì)技術(shù)展示亮點(diǎn)

作者：時(shí)間：2024-08-28 來(lái)源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

近日，在2024年Hot Chips大會(huì)上，英特爾展示了其技術(shù)的全面與深度，涵蓋了從數(shù)據(jù)中心、云、網(wǎng)絡(luò)和邊緣到PC的各個(gè)領(lǐng)域AI用例，并介紹了其業(yè)界領(lǐng)先且完全集成的OCI（光學(xué)計(jì)算互連）芯粒，可用于高速AI數(shù)據(jù)處理。此外，英特爾還披露了關(guān)于英特爾^? 至強(qiáng)^? 6系統(tǒng)集成芯片（代號(hào)Granite Rapids-D）的最新細(xì)節(jié)，該產(chǎn)品預(yù)計(jì)將于2025年上半年發(fā)布。

本文引用地址：http://m.butianyuan.cn/article/202408/462423.htm

英特爾網(wǎng)絡(luò)與邊緣事業(yè)部首席技術(shù)官Pere Monclus表示：“針對(duì)各種消費(fèi)和企業(yè)級(jí)AI的應(yīng)用場(chǎng)景，英特爾不斷提供其創(chuàng)新所需的平臺(tái)、系統(tǒng)和技術(shù)。隨著AI工作負(fù)載不斷增長(zhǎng)，英特爾廣泛的行業(yè)經(jīng)驗(yàn)使我們能夠了解客戶的真正需求，以此推動(dòng)創(chuàng)新、創(chuàng)意和理想商業(yè)成果落地。盡管性能更高的芯片和更高的平臺(tái)帶寬至關(guān)重要，但英特爾深知每種工作負(fù)載都有其獨(dú)特的挑戰(zhàn)。因此，為數(shù)據(jù)中心設(shè)計(jì)的系統(tǒng)不能簡(jiǎn)單地被重新應(yīng)用于邊緣。英特爾在所有計(jì)算系統(tǒng)架構(gòu)方面所擁有的經(jīng)過(guò)驗(yàn)證的專(zhuān)業(yè)知識(shí)，將更好地為下一代AI創(chuàng)新提供動(dòng)力?！?/p>

在Hot Chips 2024大會(huì)上，英特爾發(fā)表了四篇技術(shù)論文，重點(diǎn)介紹了英特爾? 至強(qiáng)? 6系統(tǒng)集成芯片、Lunar Lake客戶端處理器、英特爾^? Gaudi 3 AI加速器以及OCI（光學(xué)計(jì)算互連）芯粒。

為邊緣而生：下一代英特爾^? 至強(qiáng)^? 6系統(tǒng)集成芯片

英特爾院士、網(wǎng)絡(luò)與邊緣芯片架構(gòu)師Praveen Mosur公布了英特爾? 至強(qiáng)? 6系統(tǒng)集成芯片設(shè)計(jì)的最新細(xì)節(jié)，以及它如何能夠解決邊緣使用場(chǎng)景中存在的特定挑戰(zhàn)，例如網(wǎng)絡(luò)連接的不穩(wěn)定以及有限的空間和電力。得益于從全球超過(guò)9萬(wàn)次1邊緣部署中獲得的經(jīng)驗(yàn)，英特爾? 至強(qiáng)? 6系統(tǒng)集成芯片將成為英特爾迄今為止針對(duì)邊緣場(chǎng)景優(yōu)化程度最高的處理器。通過(guò)從邊緣設(shè)備擴(kuò)展到邊緣節(jié)點(diǎn)使用單一系統(tǒng)架構(gòu)和集成AI加速能力，企業(yè)可以更輕松、高效、安全地管理從數(shù)據(jù)攝取到推理的整個(gè)AI工作流程，從而幫助改善決策、提高自動(dòng)化水平，并為其客戶創(chuàng)造價(jià)值。

英特爾? 至強(qiáng)? 6系統(tǒng)集成芯片結(jié)合了英特爾? 至強(qiáng)? 6處理器的計(jì)算芯粒，以及采用了Intel 4制程工藝的針對(duì)邊緣進(jìn)行了優(yōu)化的I/O芯粒，使該系統(tǒng)集成芯片在性能、能效和晶體管密度方面與前代系統(tǒng)集成芯片相比獲得了顯著提升。英特爾? 至強(qiáng)? 6系統(tǒng)集成芯片的其它特性還包括：

● 支持高達(dá)32條PCI Express（PCIe）5.0通道。

● 支持多達(dá)16條Compute Express Link（CXL）2.0通道。

● 擁有2x100G以太網(wǎng)。

● 在兼容的BGA封裝中提供4個(gè)或8個(gè)內(nèi)存通道。

● 擁有專(zhuān)為邊緣環(huán)境優(yōu)化的特性，包括更大的運(yùn)行溫度范圍和工業(yè)級(jí)可靠性，使其成為高性能耐用設(shè)備的理想選擇。

英特爾^? 至強(qiáng)^? 6系統(tǒng)集成芯片還包括了用于提高邊緣和網(wǎng)絡(luò)工作負(fù)載的性能和效率的功能特性，包括：新的媒體加速功能，可增強(qiáng)實(shí)時(shí)OTT、點(diǎn)播（VOD）和廣播媒體的視頻轉(zhuǎn)碼和分析；英特爾^? 高級(jí)矢量擴(kuò)展和英特爾^? 高級(jí)矩陣擴(kuò)展（英特爾? AMX），可提高推理性能；英特爾^? 快速輔助技術(shù)（英特爾^?QAT），可實(shí)現(xiàn)能效更高的網(wǎng)絡(luò)和存儲(chǔ)性能；英特爾^? vRAN Boost，可降低虛擬化RAN的功耗；以及支持英特爾^?Tiber? 邊緣平臺(tái)，該平臺(tái)使用戶能夠在標(biāo)準(zhǔn)硬件上構(gòu)建、部署、運(yùn)行、管理和擴(kuò)展邊緣和AI解決方案，具有類(lèi)似云的簡(jiǎn)潔性。

Lunar Lake：驅(qū)動(dòng)下一代AI PC

英特爾客戶端CPU SoC首席架構(gòu)師Arik Gihon討論了Lunar Lake客戶端處理器，以及它如何為x86架構(gòu)的能效樹(shù)立新標(biāo)桿，同時(shí)提供出色的核心、圖形和客戶端AI性能。新的性能核（P核）和能效核（E核）所提供的出色性能，使SoC的功耗相比上一代最多降低了40%。新的神經(jīng)網(wǎng)絡(luò)處理單元（NPU）速度提升多達(dá)4倍，與上一代相比，使生成式AI能力也獲得了相應(yīng)提升。此外，與前代產(chǎn)品相比，全新的Xe2圖形處理單元核心將游戲和圖形性能提高了1.5倍。

即將于9月3日舉行的英特爾酷睿Ultra發(fā)布會(huì)將公布有關(guān)Lunar Lake的更多細(xì)節(jié)。

英特爾^? Gaudi 3 AI加速器：針對(duì)生成式AI的訓(xùn)練和推理而設(shè)計(jì)

AI加速器首席架構(gòu)師Roman Kaplan指出，生成式AI模型的訓(xùn)練與部署對(duì)算力提出了極為嚴(yán)苛的要求。隨著系統(tǒng)規(guī)模從單節(jié)點(diǎn)擴(kuò)展至數(shù)千節(jié)點(diǎn)的龐大集群，這使得成本與能效也迎來(lái)巨大挑戰(zhàn)。

英特爾^? Gaudi 3 AI加速器能夠有效應(yīng)對(duì)上述挑戰(zhàn)。該加速器通過(guò)創(chuàng)新的架構(gòu)——優(yōu)化的計(jì)算、內(nèi)存和網(wǎng)絡(luò)架構(gòu)，高能效矩陣乘法引擎、兩級(jí)緩存集成，以及廣泛的RoCE網(wǎng)絡(luò)（以太網(wǎng)融合RDMA技術(shù)）等策略，使得Gaudi 3 AI加速器能夠?qū)崿F(xiàn)卓越的性能與能效，助力AI數(shù)據(jù)中心以低成本、可持續(xù)的方式運(yùn)行，并解決了部署生成式AI工作負(fù)載時(shí)的擴(kuò)展性問(wèn)題。

英特爾將在今年9月分享Gaudi 3 AI加速器和未來(lái)英特爾至強(qiáng)6產(chǎn)品的更多信息。

傳輸速度高達(dá)4 Tbps的光學(xué)計(jì)算互連（OCI）芯粒，用于XPU之間的連接

英特爾硅光集成解決方案（IPS）團(tuán)隊(duì)展示了業(yè)界領(lǐng)先、完全集成的OCI芯粒與英特爾CPU封裝在一起時(shí)，運(yùn)行真實(shí)數(shù)據(jù)的情況。

硅光集成解決方案事業(yè)部光子芯片架構(gòu)師Saeed Fathololoumi介紹了這一OCI芯粒及其設(shè)計(jì)。該芯?？稍谧铋L(zhǎng)可達(dá)100米的光纖上，單向支持64個(gè)32 Gbps通道。Fathololoumi還討論了該芯粒如何滿足AI基礎(chǔ)設(shè)施對(duì)更高帶寬、更低功耗和更長(zhǎng)傳輸距離日益增長(zhǎng)的需求。英特爾的OCI芯粒推動(dòng)了高帶寬互連技術(shù)的進(jìn)步，將有助于實(shí)現(xiàn)可擴(kuò)展的CPU和GPU集群連接以及新型計(jì)算架構(gòu)，包括新興AI基礎(chǔ)設(shè)施中的一致性內(nèi)存擴(kuò)展及資源解耦，適用于數(shù)據(jù)中心和HPC（高性能計(jì)算）應(yīng)用。

AI讓企業(yè)和消費(fèi)者有機(jī)會(huì)更快地推進(jìn)創(chuàng)新。例如，消費(fèi)者現(xiàn)在可以選擇AI PC，通過(guò)智能化功能提高效率、創(chuàng)造力、游戲和娛樂(lè)體驗(yàn)以及安全性，而企業(yè)則可以利用強(qiáng)大的邊緣計(jì)算和AI來(lái)改善決策，提高自動(dòng)化水平，并從專(zhuān)有數(shù)據(jù)中獲取價(jià)值。

在Hot Chips 2024的深度技術(shù)研討會(huì)上，英特爾的不同產(chǎn)品團(tuán)隊(duì)還展現(xiàn)了獨(dú)到的技術(shù)洞見(jiàn)，以共同推動(dòng)下一代AI技術(shù)的市場(chǎng)化進(jìn)程。

免責(zé)聲明：

性能因使用方式、配置和其他細(xì)節(jié)而異。

1 英特爾內(nèi)部數(shù)據(jù)。