Microchip與韓國智能硬件公司IHWK合作開發(fā)模擬計算平臺,加速邊緣AI/ML推理
為了適應網(wǎng)絡邊緣人工智能(AI)計算及相關(guān)推理算法的快速發(fā)展,韓國智能硬件公司(IHWK)正在為神經(jīng)技術(shù)設備和現(xiàn)場可編程神經(jīng)形態(tài)設備開發(fā)神經(jīng)形態(tài)計算平臺。Microchip Technology Inc.(美國微芯科技公司)通過子公司冠捷半導體(SST)參與協(xié)助開發(fā),為該平臺SuperFlash? memBrain?神經(jīng)形態(tài)存儲器解決方案提供評估系統(tǒng)。該解決方案基于Microchip經(jīng)行業(yè)驗證的非易失性存儲器(NVM)SuperFlash技術(shù)并加以優(yōu)化,可通過模擬內(nèi)存計算方法為神經(jīng)網(wǎng)絡執(zhí)行矢量矩陣乘法(VMM)。
本文引用地址:http://m.butianyuan.cn/article/202309/450575.htmmemBrain技術(shù)評估工具包旨在讓IHWK展示其神經(jīng)形態(tài)計算平臺在邊緣運行推理算法的絕對能效。最終目標是為生成式人工智能模型、自動駕駛汽車、醫(yī)療診斷、語音處理、安全/監(jiān)控和商用無人機等應用創(chuàng)建超低功耗模擬處理單元(APU)。
由于目前用于邊緣推理的神經(jīng)網(wǎng)絡模型可能需要5000萬或更多突觸(權(quán)重)進行處理,因此純數(shù)字解決方案需要足夠帶寬來使用片外DRAM,這對神經(jīng)網(wǎng)絡計算造成了瓶頸,降低了整體計算能力。相比之下,memBrain解決方案在超低功耗亞閾值模式下將突觸權(quán)重存儲在片上浮動柵中,并使用相同存儲單元進行計算,從而顯著提高了能效和降低了系統(tǒng)延遲。與傳統(tǒng)數(shù)字DSP和基于SRAM/DRAM的方法相比,該方案可將每次推理決策的功耗降低到原來的1/20到1/10,并能顯著降低總體物料清單。
為了開發(fā)APU,IHWK 還與位于大田的韓國科學技術(shù)院(KAIST)合作進行設備開發(fā),并與位于首爾的延世大學(Yonsei University)合作提供設備設計協(xié)助。最終的 APU 預計將優(yōu)化推理的系統(tǒng)級算法,并在每瓦 20-80 TeraOPS 之間運行,實現(xiàn)了為電池供電設備設計的內(nèi)存計算解決方案的最佳性能。
Microchip技術(shù)許可業(yè)務部門SST副總裁Mark Reiten表示:“通過使用成熟的NVM而非替代性片外內(nèi)存解決方案來執(zhí)行神經(jīng)網(wǎng)絡計算和存儲權(quán)重,Microchip的memBrain內(nèi)存計算技術(shù)有望消除在網(wǎng)絡邊緣執(zhí)行人工智能處理所面臨的大規(guī)模數(shù)據(jù)通信瓶頸。與韓國領(lǐng)先的研發(fā)公司IHWK、相關(guān)高校和早期用戶開展合作,進一步證明了Microchip神經(jīng)處理技術(shù)的先進性,也將推動Microchip在人工智能領(lǐng)域的發(fā)展。”
IHWK 分公司經(jīng)理Sanghoon Yoon 表示:“韓國是人工智能半導體發(fā)展的重要熱點地區(qū)。我們的非易失性存儲器和新興存儲器專家已經(jīng)證實,Microchip基于成熟非易失性存儲器技術(shù)的memBrain產(chǎn)品是創(chuàng)建內(nèi)存計算系統(tǒng)的最佳選擇?!?/p>
將神經(jīng)模型永久存儲在memBrain解決方案的處理元件中,還可支持用于實時神經(jīng)網(wǎng)絡處理的即時開啟功能。IHWK正尋求利用SuperFlash存儲器浮動柵單元的非易失性,支持低功耗邊緣計算設備使用高級ML模型,建立機器學習推理的新基準。
評論