英特爾宣布公司40年來最大的架構(gòu)變革
英特爾在2023年的“AI Everywhere”活動上推出了對其處理架構(gòu)的徹底更新,體現(xiàn)在其移動Core Ultra處理器和將于2024年發(fā)布的桌面Core Ultra處理器中。這些架構(gòu)將傳統(tǒng)高性能CPU核心與專用核心(用于低功耗任務(wù)、圖形加速和AI加速)結(jié)合在一起。在同一活動上宣布的最新的第五代Xeon CPU側(cè)重于服務(wù)器性能,并添加了用于云AI加速的協(xié)處理器核心。
本文引用地址:http://m.butianyuan.cn/article/202312/454187.htm根據(jù)英特爾的公司愿景,AI處理的未來既在云端又在邊緣。該公司預(yù)測,到2028年,80%的個人電腦將成為“AI個人電腦”,配備有AI協(xié)處理器。
英特爾轉(zhuǎn)向神經(jīng)處理單元英特爾的AI協(xié)處理器被稱為神經(jīng)處理單元(NPU),是其最新的重大創(chuàng)新。當與其他專用CPU核心結(jié)合時,英特爾認為新處理器將提高整體性能,同時降低電力消耗并降低總體擁有成本(TCO)。
這些設(shè)備的多樣化架構(gòu)結(jié)合了在基于芯片組的系統(tǒng)中組裝的多個專用核心。芯片組通過減少每個處理器的硅實際面積并優(yōu)化每個芯片組的用途的硅晶圓,實現(xiàn)了更高的產(chǎn)量。與大多數(shù)AI加速器一樣,英特爾的NPU在很大程度上依賴于乘累加(MAC)單元。MAC通過減少在存儲器和寄存器之間移動數(shù)據(jù)的需要來加速復(fù)雜的乘法運算。
英特爾于2023年底發(fā)布了Xeon和移動處理器,計劃在2024年推出使用英特爾4的桌面PC處理器。英特爾4工藝技術(shù)是一種7納米幾何工藝,英特爾聲稱相比英特爾7工藝(10納米),它將使時鐘速度提高20%,功耗相同。Core Ultra和第五代Xeon是英特爾的第一款7納米處理器,也是自2019年以來的第一款具有更小工藝幾何的Core CPU。
從眾多相同的核心到定向的專用核心傳統(tǒng)的云AI處理使用圖形處理單元(GPU)和張量處理單元(TPU)進行大規(guī)模的并行處理和矩陣數(shù)學(xué)優(yōu)化。因此,英特爾的主流CPU長期以來一直包含GPU。在英特爾先前的架構(gòu)中,主CPU核心負責處理所有計算負載,而不考慮計算負載的大小。這將導(dǎo)致低負載任務(wù)使用比必要更多的電力,并從高負載進程中獲取CPU周期。它還將專業(yè)的數(shù)學(xué)密集型處理留給了主CPU核心,而這些核心并未針對專用操作進行優(yōu)化。
英特爾的Xeon服務(wù)器處理器及其Core移動和桌面CPU過去一直依賴于速度和優(yōu)化的軟件作為解決方法。新系統(tǒng),具有多個專用核心,是與“一刀切”哲學(xué)的激進背離,不再只增加相同核心的數(shù)量。
通過Gaudi3全面解決云AI除了新的NPU協(xié)處理器之外,英特爾還宣布了Gaudi2深度學(xué)習(xí)AI加速器的繼任者。Gaudi3 AI加速器面向云計算、大規(guī)模深度學(xué)習(xí)和生成式AI系統(tǒng)。英特爾聲稱,與Gaudi2相比,Gaudi3在BF16性能上提供了4倍的增長。
BF16(腦浮點)數(shù)字格式用于提高AI計算中的浮點數(shù)性能。它是IEEE 754 float32格式的16位變體。BF16保留了標準float32的8個指數(shù)位,但只保留了8個尾數(shù)有效數(shù)字位,而不是float32中的24位。AI更多地受益于使用16位數(shù)學(xué)帶來的速度增加,而不是因尾數(shù)精度減少而損失的性能。Gaudi3還將加倍網(wǎng)絡(luò)性能,并提供Gaudi2的1.5倍帶寬。
涉足云AI、邊緣AI和大型系統(tǒng)處理通過Xeon服務(wù)器CPU、工作站/筆記本CPU和Gaudi3加速器,英特爾已經(jīng)擴展其AI,幾乎涵蓋了所有關(guān)鍵的AI領(lǐng)域。Gaudi3將在大規(guī)模AI系統(tǒng)中找到用武之地。第五代Xeon將用于服務(wù)器農(nóng)場,將數(shù)據(jù)處理和傳統(tǒng)服務(wù)器活動與加速的AI功能相結(jié)合。而Core Ultra移動和桌面CPU將為個人用戶帶來AI。
評論