新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破

NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破

作者: 時(shí)間:2021-09-27 來(lái)源:ZOL 收藏

根據(jù)近日發(fā)布的基準(zhǔn)測(cè)試結(jié)果,在使用x86及Arm CPU進(jìn)行時(shí)取得了最佳成績(jī)。這是連續(xù)第三次在MLCommons推理測(cè)試中創(chuàng)造性能和能效紀(jì)錄。MLCommons是一家成立于2018年5月的行業(yè)基準(zhǔn)測(cè)試組織。

本文引用地址:http://m.butianyuan.cn/article/202109/428515.htm

      這場(chǎng)測(cè)試是第一次在Arm系統(tǒng)上進(jìn)行數(shù)據(jù)中心類別的測(cè)試,這使用戶在部署AI這一目前最具變革性的技術(shù)時(shí)有了更多的選擇。

      領(lǐng)先的性能

      在最新一輪測(cè)試中,由 AI平臺(tái)驅(qū)動(dòng)的系統(tǒng)在所有七項(xiàng)推理性能測(cè)試中都名列前茅,這些系統(tǒng)來(lái)自NVIDIA和其九家生態(tài)系統(tǒng)合作伙伴,包括阿里巴巴、戴爾科技、富士通、技嘉、慧與、浪潮、聯(lián)想、寧暢和超微。

      NVIDIA是唯一一家在本輪和迄今為止每一輪測(cè)試中取得所有MLPerf測(cè)試結(jié)果的公司。

      推理(Inference)指計(jì)算機(jī)通過(guò)運(yùn)行AI軟件來(lái)識(shí)別對(duì)象或進(jìn)行預(yù)測(cè)。在這個(gè)過(guò)程中,計(jì)算機(jī)使用深度學(xué)習(xí)模型來(lái)過(guò)濾數(shù)據(jù),進(jìn)而發(fā)現(xiàn)人類所無(wú)法捕捉的結(jié)果。

      MLPerf推理基準(zhǔn)測(cè)試基于當(dāng)今最常用的AI工作負(fù)載和場(chǎng)景,涵蓋計(jì)算機(jī)視覺(jué)、醫(yī)學(xué)影像、自然語(yǔ)言處理、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)等。

      因此,無(wú)論用戶部署何種AI應(yīng)用,都可以通過(guò)NVIDIA創(chuàng)造自己的紀(jì)錄。

      為什么性能十分重要

      隨著AI用例從數(shù)據(jù)中心擴(kuò)展到邊緣和其他領(lǐng)域,AI模型和數(shù)據(jù)集將不斷增加。就是為什么用戶需要既可靠又能靈活部署的性能。

      MLPerf讓用戶有信心做出明智的購(gòu)買決定。該組織得到了幾十家行業(yè)領(lǐng)導(dǎo)者的支持,包括阿里巴巴、Arm、百度、谷歌、英特爾和NVIDIA,因此這些測(cè)試是透明的和客觀的。

      將Arm靈活應(yīng)用于企業(yè)AI

      憑借在能效性能上的不斷增長(zhǎng)和不斷擴(kuò)展的軟件生態(tài)系統(tǒng),Arm架構(gòu)正在向全球各地的數(shù)據(jù)中心進(jìn)軍。

      最新基準(zhǔn)測(cè)試表明,作為GPU加速的平臺(tái),在工作中,使用Ampere Altra CPU的與具有類似配置的X86服務(wù)器提供的性能幾乎相同。事實(shí)上,在其中的一項(xiàng)測(cè)試中,的性能甚至超過(guò)了類似配置的x86系統(tǒng)。

      NVIDIA一直以來(lái)支持所有類型的CPU架構(gòu),十分高興地看到Arm在同行評(píng)審的行業(yè)基準(zhǔn)測(cè)試中能夠證明其AI性能。

      Arm高性能計(jì)算和工具高級(jí)總監(jiān)DavidLecomber表示:“作為MLCommons的創(chuàng)始成員,Arm致力于通過(guò)創(chuàng)建標(biāo)準(zhǔn)和基準(zhǔn)來(lái)更好地應(yīng)對(duì)挑戰(zhàn)并激發(fā)加速計(jì)算行業(yè)的創(chuàng)新?!?/p>

      “最新推理結(jié)果表明,Arm CPU和NVIDIA GPU驅(qū)動(dòng)的Arm系統(tǒng)已能夠應(yīng)對(duì)數(shù)據(jù)中心中的各種AI工作負(fù)載。”

      NVIDIA合作伙伴展示其AI性能

      NVIDIA AI技術(shù)得到了廣大和日益擴(kuò)展的生態(tài)系統(tǒng)的支持。

      在最新基準(zhǔn)測(cè)試中,七家OEM廠商共提交了22個(gè)GPU加速的平臺(tái)。

      這些服務(wù)器中的大多數(shù)型號(hào)都是NVIDIA認(rèn)證系統(tǒng),經(jīng)驗(yàn)證可以運(yùn)行多種加速工作負(fù)載,而且其中很多型號(hào)都支持上個(gè)月正式發(fā)布的NVIDIA AI Enterprise軟件。

      參與本輪測(cè)試的合作伙伴包括戴爾科技、富士通、慧與、浪潮、聯(lián)想、寧暢、超微以及云服務(wù)提供商阿里巴巴。

      軟件的力量

      NVIDIA能夠在所有AI用例中取得成功的一個(gè)關(guān)鍵因素是其完整的軟件棧。

      在推理方面,這包括針對(duì)各種用例的預(yù)訓(xùn)練AI模型。NVIDIA TAO Toolkit運(yùn)用遷移學(xué)習(xí)為特定應(yīng)用定制這些模型。

      NVIDIA TensorRT軟件對(duì)AI模型進(jìn)行了優(yōu)化,使其能夠最有效地運(yùn)用內(nèi)存并且實(shí)現(xiàn)更快的運(yùn)行速度。NVIDIA經(jīng)常使用該軟件進(jìn)行MLPerf測(cè)試,該軟件可用于X86和Arm的系統(tǒng)。

      在這些基準(zhǔn)測(cè)試中,NVIDIA還采用了NVIDIA Triton推理服務(wù)器軟件和多實(shí)例GPU(MIG)功能。它們?yōu)樗虚_(kāi)發(fā)者提供了通常需要專家級(jí)程序員才能實(shí)現(xiàn)的性能。

      隨著該軟件棧的不斷改進(jìn),與四個(gè)月前的MLPerf推理基準(zhǔn)測(cè)試相比,NVIDIA提升了高達(dá)20%的性能和15%的能效。

      NVIDIA在最新測(cè)試中所使用的所有軟件都可以從MLPerf資源庫(kù)中獲得,因此任何人都可以重現(xiàn)NVIDIA的基準(zhǔn)測(cè)試結(jié)果。NVIDIA會(huì)陸續(xù)將這些代碼添加到NVIDIA的深度學(xué)習(xí)框架和容器中,用戶可在NVIDIA的GPU應(yīng)用軟件中心NGC上獲得這些框架和容器。

      其作為全棧式AI平臺(tái)的一部分,支持所有主要的處理器架構(gòu),已在最新行業(yè)基準(zhǔn)測(cè)試中得到了驗(yàn)證,并可通過(guò)多家合作伙伴獲取,助力客戶應(yīng)對(duì)當(dāng)今的實(shí)際AI工作任務(wù)。



關(guān)鍵詞: NVIDIA AI推理 Arm服務(wù)器

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉