NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破
根據(jù)近日發(fā)布的基準(zhǔn)測(cè)試結(jié)果,NVIDIA在使用x86及Arm CPU進(jìn)行AI推理時(shí)取得了最佳成績(jī)。這是NVIDIA連續(xù)第三次在MLCommons推理測(cè)試中創(chuàng)造性能和能效紀(jì)錄。MLCommons是一家成立于2018年5月的行業(yè)基準(zhǔn)測(cè)試組織。
本文引用地址:http://m.butianyuan.cn/article/202109/428515.htm這場(chǎng)測(cè)試是第一次在Arm系統(tǒng)上進(jìn)行數(shù)據(jù)中心類別的測(cè)試,這使用戶在部署AI這一目前最具變革性的技術(shù)時(shí)有了更多的選擇。
領(lǐng)先的性能
在最新一輪測(cè)試中,由NVIDIA AI平臺(tái)驅(qū)動(dòng)的系統(tǒng)在所有七項(xiàng)推理性能測(cè)試中都名列前茅,這些系統(tǒng)來(lái)自NVIDIA和其九家生態(tài)系統(tǒng)合作伙伴,包括阿里巴巴、戴爾科技、富士通、技嘉、慧與、浪潮、聯(lián)想、寧暢和超微。
NVIDIA是唯一一家在本輪和迄今為止每一輪測(cè)試中取得所有MLPerf測(cè)試結(jié)果的公司。
推理(Inference)指計(jì)算機(jī)通過(guò)運(yùn)行AI軟件來(lái)識(shí)別對(duì)象或進(jìn)行預(yù)測(cè)。在這個(gè)過(guò)程中,計(jì)算機(jī)使用深度學(xué)習(xí)模型來(lái)過(guò)濾數(shù)據(jù),進(jìn)而發(fā)現(xiàn)人類所無(wú)法捕捉的結(jié)果。
MLPerf推理基準(zhǔn)測(cè)試基于當(dāng)今最常用的AI工作負(fù)載和場(chǎng)景,涵蓋計(jì)算機(jī)視覺(jué)、醫(yī)學(xué)影像、自然語(yǔ)言處理、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)等。
因此,無(wú)論用戶部署何種AI應(yīng)用,都可以通過(guò)NVIDIA創(chuàng)造自己的紀(jì)錄。
為什么性能十分重要
隨著AI用例從數(shù)據(jù)中心擴(kuò)展到邊緣和其他領(lǐng)域,AI模型和數(shù)據(jù)集將不斷增加。就是為什么用戶需要既可靠又能靈活部署的性能。
MLPerf讓用戶有信心做出明智的購(gòu)買決定。該組織得到了幾十家行業(yè)領(lǐng)導(dǎo)者的支持,包括阿里巴巴、Arm、百度、谷歌、英特爾和NVIDIA,因此這些測(cè)試是透明的和客觀的。
將Arm靈活應(yīng)用于企業(yè)AI
憑借在能效性能上的不斷增長(zhǎng)和不斷擴(kuò)展的軟件生態(tài)系統(tǒng),Arm架構(gòu)正在向全球各地的數(shù)據(jù)中心進(jìn)軍。
最新基準(zhǔn)測(cè)試表明,作為GPU加速的平臺(tái),在AI推理工作中,使用Ampere Altra CPU的Arm服務(wù)器與具有類似配置的X86服務(wù)器提供的性能幾乎相同。事實(shí)上,在其中的一項(xiàng)測(cè)試中,Arm服務(wù)器的性能甚至超過(guò)了類似配置的x86系統(tǒng)。
NVIDIA一直以來(lái)支持所有類型的CPU架構(gòu),十分高興地看到Arm在同行評(píng)審的行業(yè)基準(zhǔn)測(cè)試中能夠證明其AI性能。
Arm高性能計(jì)算和工具高級(jí)總監(jiān)DavidLecomber表示:“作為MLCommons的創(chuàng)始成員,Arm致力于通過(guò)創(chuàng)建標(biāo)準(zhǔn)和基準(zhǔn)來(lái)更好地應(yīng)對(duì)挑戰(zhàn)并激發(fā)加速計(jì)算行業(yè)的創(chuàng)新?!?/p>
“最新推理結(jié)果表明,Arm CPU和NVIDIA GPU驅(qū)動(dòng)的Arm系統(tǒng)已能夠應(yīng)對(duì)數(shù)據(jù)中心中的各種AI工作負(fù)載。”
NVIDIA合作伙伴展示其AI性能
NVIDIA AI技術(shù)得到了廣大和日益擴(kuò)展的生態(tài)系統(tǒng)的支持。
在最新基準(zhǔn)測(cè)試中,七家OEM廠商共提交了22個(gè)GPU加速的平臺(tái)。
這些服務(wù)器中的大多數(shù)型號(hào)都是NVIDIA認(rèn)證系統(tǒng),經(jīng)驗(yàn)證可以運(yùn)行多種加速工作負(fù)載,而且其中很多型號(hào)都支持上個(gè)月正式發(fā)布的NVIDIA AI Enterprise軟件。
參與本輪測(cè)試的合作伙伴包括戴爾科技、富士通、慧與、浪潮、聯(lián)想、寧暢、超微以及云服務(wù)提供商阿里巴巴。
軟件的力量
NVIDIA能夠在所有AI用例中取得成功的一個(gè)關(guān)鍵因素是其完整的軟件棧。
在推理方面,這包括針對(duì)各種用例的預(yù)訓(xùn)練AI模型。NVIDIA TAO Toolkit運(yùn)用遷移學(xué)習(xí)為特定應(yīng)用定制這些模型。
NVIDIA TensorRT軟件對(duì)AI模型進(jìn)行了優(yōu)化,使其能夠最有效地運(yùn)用內(nèi)存并且實(shí)現(xiàn)更快的運(yùn)行速度。NVIDIA經(jīng)常使用該軟件進(jìn)行MLPerf測(cè)試,該軟件可用于X86和Arm的系統(tǒng)。
在這些基準(zhǔn)測(cè)試中,NVIDIA還采用了NVIDIA Triton推理服務(wù)器軟件和多實(shí)例GPU(MIG)功能。它們?yōu)樗虚_(kāi)發(fā)者提供了通常需要專家級(jí)程序員才能實(shí)現(xiàn)的性能。
隨著該軟件棧的不斷改進(jìn),與四個(gè)月前的MLPerf推理基準(zhǔn)測(cè)試相比,NVIDIA提升了高達(dá)20%的性能和15%的能效。
NVIDIA在最新測(cè)試中所使用的所有軟件都可以從MLPerf資源庫(kù)中獲得,因此任何人都可以重現(xiàn)NVIDIA的基準(zhǔn)測(cè)試結(jié)果。NVIDIA會(huì)陸續(xù)將這些代碼添加到NVIDIA的深度學(xué)習(xí)框架和容器中,用戶可在NVIDIA的GPU應(yīng)用軟件中心NGC上獲得這些框架和容器。
其作為全棧式AI平臺(tái)的一部分,支持所有主要的處理器架構(gòu),已在最新行業(yè)基準(zhǔn)測(cè)試中得到了驗(yàn)證,并可通過(guò)多家合作伙伴獲取,助力客戶應(yīng)對(duì)當(dāng)今的實(shí)際AI工作任務(wù)。
評(píng)論