富士通也要做AI了,一上來就是DLU微處理器?
據(jù)報導(dǎo),富士通自2015年以來便投入DLU芯片開發(fā)工作,不過此前富士通很少對外透露這款微處理器的設(shè)計細節(jié),直到2017年6月舉辦的“ISC 2017”大會上,富士通AI基盤事業(yè)本部(AI Platform Division)資深主任丸山拓巳(Takumi Maruyama)才對外透露該公司投入AI及高效能運算(HPC)領(lǐng)域的發(fā)展成果,首度較深入介紹DLU微處理器運作細節(jié)。目前丸山便正從事于DLU芯片開發(fā)專案。
本文引用地址:http://m.butianyuan.cn/article/201707/362128.htm丸山指出,DLU微處理器與其他多款專為深度學(xué)習(xí)(DL)所打造的處理器相同的是,均高度仰賴于低精密度運算在神經(jīng)網(wǎng)絡(luò)處理上優(yōu)化效能及能源效率,值得注意的是,DLU微處理器支援FP32、FP16、INT16以及INT8數(shù)據(jù)類型。在最高等級上,DLU微處理器是由若干“深度學(xué)習(xí)處理單元”(Deep Learning Processing Units;DPU)所組成,透過一個高效能構(gòu)造進行互相連結(jié),或可將這些DPUs視為是深度學(xué)習(xí)的核心。 個別的主核心管理在DPU上的執(zhí)行,并負責(zé)在DPU與芯片內(nèi)建存儲器控制器之間協(xié)調(diào)存儲器近用任務(wù)。
值得注意的是,每個DPU均是由16個深度學(xué)習(xí)處理元素(DPE)所組成,這也是實際數(shù)值運算進行之處;每個DPE則是由8個SIMD執(zhí)行單位連同一個非常大型的注冊檔(Register File; RF)所組成,此RF完全受到軟件的控制。
另外,DLU封裝將包含一定數(shù)量的第二代高頻寬存儲器(HBM2),這款存儲器能夠高速提供處理器所需數(shù)據(jù),該DLU封裝也將包含一個用于透過Tofu互聯(lián)技術(shù)與其他DLU微處理器相連結(jié)的介面,富士通預(yù)計2018年度將推出DLU微處理器,且將先以協(xié)同處理器形式問世,由一組中央處理器(CPU)來驅(qū)動DLU微處理器。
自下一代DLU微處理器技術(shù)開始,富士通計劃將DLU微處理器以某種形式嵌入一組CPU中,不過富士通仍未透露此下一代技術(shù)何時將推出。借由上述芯片外(off-chip)網(wǎng)路設(shè)計,富士通設(shè)想未來能夠以DLU微處理器打造非常龐大的系統(tǒng),目標創(chuàng)建可擴充的平臺供處理最大且最復(fù)雜的深度學(xué)習(xí)問題。 富士通的最終計劃目標,是要除了擁有面向一般市場的SPARC處理器產(chǎn)品線外,也要打造一個DLU微處理器產(chǎn)品線。
富士通了解到AI與機器學(xué)習(xí)(ML)在不久的將來可望主導(dǎo)全球科技應(yīng)用領(lǐng)域,如果不跟進恐面臨在未來遭邊緣化的危機,目前則是由NVIDIA居于這市場的領(lǐng)先地位,但英特爾(Intel)、AMD(AMD)及英國AI芯片硬件設(shè)計新創(chuàng)企業(yè)Graphcore等廠商,均在發(fā)展自有AI芯片技術(shù)上積極投入,預(yù)計未來6~12個月可能將相繼推出新產(chǎn)品線,屆時也將成為富士通DLU微處理器的新競爭對手。
NVIDIA在這塊領(lǐng)域具備的優(yōu)勢,在于該公司為自有繪圖芯片(GPU)開發(fā)的深度學(xué)習(xí)軟件支援,能夠讓NVIDIA在AI芯片市場上取得較大領(lǐng)先優(yōu)勢,用于處理神經(jīng)網(wǎng)路的軟件架構(gòu)數(shù)量不僅多且仍在增長,但NVIDIA能夠完全提供支持,反觀微軟(Microsoft)、CNTK、Theano、MXNet、Torch、TensorFlow以及Caffe等廠商最多只能支持主要的軟件架構(gòu)部分。
即使如此,對于擁有較龐大資金規(guī)模的廠商如富士通及其他廠商來說,這塊領(lǐng)域雖然已有大量深度學(xué)習(xí)軟件已經(jīng)被寫入,但相對于未來幾年可能發(fā)展的數(shù)量來說仍是九牛一毛,這意謂在這塊領(lǐng)域未來幾年仍有容納其他新進競爭廠商的許多空間,這讓富士通等新進廠商仍有搶食這塊市場商機的機會。
評論