英特爾以全棧軟硬件布局,擁抱人工智能發(fā)展新機(jī)遇
今日,英特爾數(shù)據(jù)中心與人工智能集團(tuán)副總裁兼中國區(qū)總經(jīng)理陳葆立在2023年中國國際服務(wù)貿(mào)易交易會(huì)的中國AIGC創(chuàng)新發(fā)展論壇上,發(fā)表題為“面向中國市場的英特爾AI戰(zhàn)略”的演講。陳葆立從通用計(jì)算和加速計(jì)算兩個(gè)維度出發(fā),詳細(xì)闡述了英特爾如何通過全面的異構(gòu)產(chǎn)品組合以及開放的軟件棧,與廣泛的中國生態(tài)伙伴持續(xù)探索和創(chuàng)新,以把握AI時(shí)代機(jī)遇,創(chuàng)造無限可能。
本文引用地址:http://m.butianyuan.cn/article/202309/450228.htm陳葆立指出,“致力于創(chuàng)造改變世界的技術(shù),英特爾自1985年進(jìn)入中國以來,始終通過不斷的技術(shù)變革,為中國客戶創(chuàng)造更高價(jià)值,推動(dòng)更深層的本地創(chuàng)新和發(fā)展。在AI‘黃金時(shí)代’的初期,憑借在芯片制造和創(chuàng)新領(lǐng)域的深厚積累,英特爾也正利用自身的行業(yè)領(lǐng)先優(yōu)勢,通過在云、網(wǎng)絡(luò)、邊緣、客戶端等領(lǐng)域的全方位布局,為行業(yè)的持續(xù)發(fā)展提供助力?!?/p>
AI的數(shù)據(jù)流包括廣泛而復(fù)雜的工作負(fù)載和多模態(tài)數(shù)據(jù)集。而面對AI的計(jì)算需求,并沒有一種通用的解決方案。如今,受多重技術(shù)和經(jīng)濟(jì)因素影響,很大一部分AI工作負(fù)載是在通用處理器上運(yùn)行。x86架構(gòu)的大規(guī)模普及和其內(nèi)置的AI能力使通用處理器已經(jīng)成為解決AI數(shù)據(jù)流的理想解決方案。
基于此,英特爾在企業(yè)級硬件方面,打造內(nèi)置英特爾?高級矩陣擴(kuò)展(英特爾? AMX)加速引擎的第四代英特爾?至強(qiáng)?可擴(kuò)展處理器,提供比上一代高達(dá)10倍的AI推理和訓(xùn)練性能提升,并實(shí)現(xiàn)對大多數(shù)大型AI模型,包括實(shí)時(shí)、中等吞吐量、低延遲稀疏推理,以及中、小型規(guī)模的訓(xùn)練和邊緣推理的支持。此外,還通過廣泛的生態(tài)系統(tǒng)、專用于簡化流程的軟件工具以及優(yōu)化的編譯器,讓客戶能夠更輕松部署英特爾解決方案,以及持續(xù)對更高級別軟件堆棧的投入,如oneAPI和OpenVINO,讓開發(fā)者更輕松地使用其所熟悉的AI框架。
基于集成英特爾?AMX的第四代英特爾?至強(qiáng)?可擴(kuò)展處理器,百度也打造自身的人工智能自然語言處理模型ERNIE-Tiny。這款百度在飛槳文心大模型核心產(chǎn)品上推出的輕量化版本,在引入英特爾? AMX之后,整體推理性能得到多倍提升,同時(shí)也使其在通用CPU平臺(tái)上獲得令人滿意的推理效能,從而能進(jìn)一步擴(kuò)大普范圍,幫助更多用戶在既有IT設(shè)施中更為方便地部署文心模型。
而面臨爆炸式增長的個(gè)人電腦AI應(yīng)用,英特爾在提供強(qiáng)大硬件的同時(shí),也通過可擴(kuò)展的軟件棧加持,讓更多開源模型能夠運(yùn)行在個(gè)人的客戶端上。一方面,第13代英特爾?酷睿?處理器通過XPU加速、低位量化、軟件優(yōu)化以及對16GB及以上內(nèi)存容量的支持,使得高達(dá)160億參數(shù)的大型語言模型能夠通過BigDL-LLM框架在個(gè)人電腦上運(yùn)行。而英特爾?銳炬?Xe顯卡和英特爾銳炫?顯卡通過硬件優(yōu)化和精度控制,能夠穩(wěn)定地支持FP16精度的深度學(xué)習(xí)模型推理。這對于加速深度學(xué)習(xí)工作負(fù)載,提高計(jì)算效率具有重要意義。另一方面,英特爾亦通過可擴(kuò)展的軟件棧支持通用AI框架,使得用戶可以輕松地在不同框架中進(jìn)行模型推理。
盡管英特爾至強(qiáng)?可擴(kuò)展?處理器可以運(yùn)行諸多AI工作負(fù)載,但為支持更大的模型規(guī)模和滿足廣泛的系統(tǒng)需求,需要采用異構(gòu)計(jì)算的方法,使用不同的計(jì)算架構(gòu)。對于這些應(yīng)用場景,英特爾?數(shù)據(jù)中心GPU Max系列和Gaudi深度學(xué)習(xí)加速器可提供硬件支持。其中,英特爾全新Gaudi2處理器于今年7月面世中國市場。作為英特爾從云到端產(chǎn)品組合的重要組成,為深度學(xué)習(xí)而生的Gaudi2致力于以多方位性能與能效比提升,加速AI訓(xùn)練及推理。值得注意的是,其出色的性能表現(xiàn)亦在近期公布的MLCommons? MLPerf?基準(zhǔn)測試1中得到充分驗(yàn)證,與其他同類產(chǎn)品相比,是大規(guī)模部署AI的更優(yōu)解。而得益于SynapseAI?軟件套件的優(yōu)化,Gaudi2在簡化模型的開發(fā)和遷移方面也獨(dú)具優(yōu)勢。
一直以來,英特爾始終在中國積極推動(dòng)技術(shù)轉(zhuǎn)型,不僅加速PC在中國的普及率,也通過與廣大本地生態(tài)伙伴的深入合作,推動(dòng)云計(jì)算和邊緣計(jì)算發(fā)展,賦能行業(yè)的數(shù)字化轉(zhuǎn)型。在人工智能浪潮呈席卷之勢的當(dāng)下,英特爾也將利用自身的深厚積淀與前沿洞察,與生態(tài)伙伴一同緊抓行業(yè)發(fā)展新機(jī)遇,為AI在中國的全面綻放注入源源不斷的動(dòng)力。
注釋:1. https://mlcommons.org/en/training-normal-30
評論