蘋果、華為接連入局,移動AI芯片成為競爭新焦點
近期,蘋果發(fā)布A11Bionic神經(jīng)引擎、華為發(fā)布麒麟970集成NPU,端側(cè)人工智能成為業(yè)內(nèi)熱點,高門檻的人工智能一夜間要飛入尋常百姓家了,對于智能手機(jī)人工智能我們應(yīng)該抱有怎樣的期待呢?
本文引用地址:http://m.butianyuan.cn/article/201711/371030.htm正在被輿論泡沫化的人工智能其實剛上路
隨著互聯(lián)網(wǎng)+的大潮/光環(huán)/紅利的退潮,市場、產(chǎn)業(yè)、投資都需要新熱點。人工智能被稱為是未來十年的熱點,是受益于計算能力、大數(shù)據(jù)集、深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域都在取得了超乎尋常的進(jìn)步,人工智能類新興技術(shù)在Gartner2017新興技術(shù)成熟度曲線上快速移動。
一個危險的信號是市場幾乎到了不談AI就是落伍的地步,人工智能投資和輿論正在泡沫化。適度的泡沫利于新興技術(shù)的快速普及與商用化,但當(dāng)一個概念被熱炒天花亂墜后,最大的危機(jī)在于不落地用戶可感知性不強(qiáng)。
每個廠商都在談自己的手機(jī)人工智能了,云山霧繞,但更多是只聞樓梯腳步聲,對于最終消費者而言,也許只是其中的一點(畢竟人工智能的范疇太廣),亦或是僅僅是停留在宣傳上再包裝的換湯不換藥。
畢竟,屬于人工智能的時代才剛剛開始。
端側(cè)人工智能面臨挑戰(zhàn),但也有獨特優(yōu)勢,專用硬件AI芯片成為優(yōu)選
現(xiàn)階段AI計算主要通過深度學(xué)習(xí)來進(jìn)行,分為訓(xùn)練和推斷兩類。訓(xùn)練主要是云端訓(xùn)練是根據(jù)已知數(shù)據(jù)尋找模型參數(shù)的過程,主要依賴于云端海量數(shù)據(jù)與復(fù)雜神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),計算量巨大。由于端側(cè)缺乏大規(guī)模數(shù)據(jù),暫缺乏端側(cè)模型訓(xùn)練。而在云端與終端側(cè)均可進(jìn)行推斷,推斷是根據(jù)已有模型,對具體某個應(yīng)用(圖片、語音、翻譯等)在云端/終端側(cè)進(jìn)行判斷(大量矩陣運算),并返回結(jié)果。
云端AI芯片路線基本確立,GPU用于訓(xùn)練,F(xiàn)PGA用于推斷,谷歌另辟蹊徑開發(fā)ASIC(TPU)可同時完成訓(xùn)練和推斷。端側(cè)AI芯片則根據(jù)不同的終端類型,有著不同解決方案,GPU、FPGA、ASIC、NPU(SoC中AIASIC)等都有應(yīng)用。
相比云端訓(xùn)練及推斷的蓬勃發(fā)展,端智能確實相對滯后,主要受制于手機(jī)側(cè)的計算性能,智能手機(jī)無論是體積、供電、散熱和能耗等方面相比云端服務(wù)器計算,在支持AI方面面臨著巨大的挑戰(zhàn)。
但是相對于云端的人工智能來說,智能終端側(cè)部署人工智能在隱私保護(hù)、帶寬需求、實時性/低延時、功耗以及體驗等眾多方面又都更有優(yōu)勢。
手機(jī)SoC芯片既要不斷追求最好的性能,同時對每一個能力的加入又必須用最高的性能密度和最好的能源效率的方式進(jìn)行,這對芯片的設(shè)計提出了超高的要求。
考慮到前述功耗、帶寬、性能、可靠性、安全和延遲方面因素,用硬件來實現(xiàn)機(jī)器學(xué)習(xí)和深度學(xué)習(xí),相比軟件+云計算方案更有優(yōu)勢,神經(jīng)網(wǎng)絡(luò)處理成為人工智能手機(jī)SoC的關(guān)鍵處理單元是必然趨勢,如同CPU、GPU、音視頻編解碼器一樣,在智能終端側(cè)部署人工智能已經(jīng)是大勢所趨
移動AI芯片成為競爭新焦點,華為、蘋果目前領(lǐng)先半個身位,2018年則可能遍地開花
人工智能芯片可以稱為芯片發(fā)展史上的又一次專業(yè)分化,當(dāng)初GPU也是這么走過來的,主要目標(biāo)仍是縮短計算時間、降低計算能耗。
ARM
在年初發(fā)布針對人工智能及機(jī)器學(xué)習(xí)進(jìn)行優(yōu)化的DynamIQ技術(shù),實現(xiàn)了在單一計算集群上進(jìn)行大小核配置,對每一個處理器進(jìn)行獨立的頻率控制以及開、關(guān)、休眠狀態(tài)的控制,可以實現(xiàn)在不同任務(wù)間高效無縫切換最合適的處理器。將加入針對人工智能的指令集和優(yōu)化庫,下一代ARMV8.2版本的指令集將支持神經(jīng)網(wǎng)路卷積運算,提升通用SoC芯片的人工智能和機(jī)器學(xué)習(xí)的效率。
最近,英國ImaginaTIon發(fā)布了最新神經(jīng)網(wǎng)絡(luò)加速器PowerVR2NXNNA,相信ARM的專用AI芯片IP大概率會在2018年面世。
高通
高通在2016年發(fā)布Zeroth平臺時發(fā)布了神經(jīng)處理引擎SDK包,支持主流的深度學(xué)習(xí)框架Caffe、TensorFlow等。同時,高通收購荷蘭機(jī)器學(xué)習(xí)初創(chuàng)公司Scyfer,投資神經(jīng)科學(xué)初創(chuàng)公司BrainCorp,不斷強(qiáng)化人工智能方面的布局。在華為、蘋果相繼推出專用AI芯片單元后,高通旗艦芯片實現(xiàn)AI能力硬化是必然,據(jù)傳高通已經(jīng)開始設(shè)計制造執(zhí)行神經(jīng)網(wǎng)絡(luò)的專用芯片,焦點可能在于高通是自研還是用哪家的IP。
MTK
據(jù)傳,聯(lián)發(fā)科已完成了手機(jī)芯片內(nèi)置AI運算單元的設(shè)計,預(yù)計2018年上市的HelioP70芯片將內(nèi)建神經(jīng)網(wǎng)絡(luò)及視覺運算單元(NeuralandVisualProcessingUnit,NVPU)。
蘋果
蘋果iPhone8系列中應(yīng)用的A11Bionic應(yīng)用處理器,引入神經(jīng)網(wǎng)絡(luò)處理引擎(NE,NeuralEngine),面向特定機(jī)器學(xué)習(xí)算法,處理支持新iPhone中3DSensor、人臉識別解鎖、Animoji等功能。
華為
麒麟970設(shè)計了HiAI移動計算架構(gòu),首次集成NPU(NeuralNetworkProcessingUnit)專用硬件處理單元,其AI性能密度大幅優(yōu)于CPU和GPU,基于AI實現(xiàn)智能場景識別與對象識別并進(jìn)行針對性優(yōu)化,提升用戶拍照效果。
可以大膽推測,在2018-19年,旗艦智能手機(jī)支持專用AI芯片是大概率事件,能力具備了,但這并不意味著智能手機(jī)就真正到了愿景中的人工智能階段。業(yè)內(nèi)又在尋找基于深度學(xué)習(xí)的殺手級APP出現(xiàn),其實也許這就是個偽命題,拍照、面部識別等現(xiàn)有應(yīng)用體驗的優(yōu)化,更有資格成為首批AI受益應(yīng)用。
SoC集成專用AI芯片大幅提升計算能力,但移動端AI體驗仍任重而道遠(yuǎn)
傳統(tǒng)CPU、GPU和DSP本質(zhì)上并非以硬件神經(jīng)元和突觸為基本處理單元,相對于NPU在深度學(xué)習(xí)方面天生會有一定劣勢,在芯片集成度和制造工藝水平相當(dāng)?shù)那闆r下,理論上表現(xiàn)將遜色于NPU。
據(jù)華為官方宣稱,麒麟970相較于四個Cortex-A73核心,在處理同樣的AI應(yīng)用任務(wù)時,新的異構(gòu)計算架構(gòu)擁有大約25倍性能和50倍能效優(yōu)勢。以圖像識別速度為例,麒麟970可達(dá)到約2005張/分鐘。
嚴(yán)格意義上講,現(xiàn)階段我們或許并不應(yīng)該期待人工智能產(chǎn)生全新的應(yīng)用,更多應(yīng)該期待的是通過人工智能技術(shù),讓現(xiàn)有的應(yīng)用效率更高、能效更低、體驗更好。目前最成熟的兩個AI應(yīng)用領(lǐng)域是語音識別和圖像識別,而蘋果和華為的專用AI芯片也均選擇在兩個領(lǐng)域進(jìn)行突破,提升用戶最常用應(yīng)用的體驗。
圖像識別:華為的AI+慧眼、蘋果的FaceID解鎖
拍照現(xiàn)在用戶最關(guān)注的體驗,通過AI提升體驗是個感知度高的選擇。華為麒麟970通過AI實現(xiàn)拍照過程中場景識別、對象識別然后進(jìn)行智能優(yōu)化。場景識別比如運動場景、夜間環(huán)境等,提升優(yōu)化運動場景下的定格清晰度與暗光拍照效果。對象識別比如人臉識別,針對不同膚色、帽子、眼睛、口罩、遮擋、側(cè)臉等多種復(fù)雜的人臉場景進(jìn)行智能檢測,針對性的改善人臉部信息的色彩和補光、人臉追焦的優(yōu)化等。相當(dāng)于把已有的專業(yè)級拍照模型(知識庫)通過AI芯片應(yīng)用于用戶的拍照過程中,而無需再去學(xué)習(xí)專業(yè)的拍照技能。
iPhoneX在圖像識別方面的面部識別解鎖極具炫耀性體驗,終端側(cè)基于結(jié)構(gòu)光方案建立用戶臉部3D數(shù)據(jù),解鎖比對通過A11芯片中的神經(jīng)網(wǎng)絡(luò)模塊神經(jīng)引擎(NeuralEngine)進(jìn)行處理。
語音識別:AI降噪提升語音識別率、siri升級版
麒麟970A芯片I降噪是通過應(yīng)用人工智能噪聲模型替換傳統(tǒng)的反相技術(shù)消噪模型,抑制非穩(wěn)態(tài)噪音,增強(qiáng)語音信號,把高速、車內(nèi)噪聲大環(huán)境下的語音識別率從80%提升到92%(華為實驗室官方數(shù)據(jù))。
作為普及人工智能的啟蒙應(yīng)用,siri居功至偉,在新iPhone發(fā)布會上,Siri相比前幾代也有明顯的提升,想必也用到了蘋果機(jī)器學(xué)習(xí)博客中提到的新AI技術(shù),并進(jìn)一步擴(kuò)展siri的服務(wù)能力。
其他的AI應(yīng)用體驗,諸如,照片應(yīng)用的圖像識別,相冊歸類;聽歌推薦,通過對用戶聽歌記錄的學(xué)習(xí)來調(diào)整作出相應(yīng)的推薦;智能回復(fù)/推薦,基于云端知識庫預(yù)測用戶的信息回復(fù)與情緒表達(dá);續(xù)航優(yōu)化,基于用戶使用行為的機(jī)器學(xué)習(xí)進(jìn)行調(diào)整電池管理等,都是實用性很強(qiáng)的AI體驗。
顯然,人們對于人工智能手機(jī)的期望不只是這些。整體而言,人工智能技術(shù)是一種基礎(chǔ)能力屬于使能層,集成專用AI芯片,突破的是性能瓶頸,而未來的AI體驗仍將是應(yīng)用場景驅(qū)動。無論是模型還是知識庫還是基于AI應(yīng)用,都有賴于生態(tài)合作,有賴于第三方應(yīng)用開發(fā)者調(diào)用AI芯片開放的能力進(jìn)行開發(fā),進(jìn)而發(fā)揮AI芯片的算力。
展望未來,移動芯片的引領(lǐng)制勝法寶則是人工智能、5G兩翼齊飛不瘸腿
1、AI芯片成功的關(guān)鍵是人工智能應(yīng)用生態(tài)的構(gòu)建
華為與蘋果幾乎同時推出專用AI處理單元芯片,考慮到18個月的芯片設(shè)計周期,需要給華為麒麟芯片點贊。SoC芯片集成專用AI芯片堪稱端側(cè)人工智能里程碑,并有望快速普及,但只是人工智能的第一步,遠(yuǎn)談不上勝利,我看到的更多是挑戰(zhàn)。
未來AI芯片的競爭,不僅僅取決于芯片廠商自身的技術(shù)研發(fā),更取決于生態(tài)運作能力包括垂直領(lǐng)域的知識庫/模型合作以及第三方應(yīng)用開發(fā)者,看誰的生態(tài)能夠提供的應(yīng)用更豐富、體驗更好。對于華為而言,挑戰(zhàn)更甚于當(dāng)初在基帶領(lǐng)域的單點突破到不斷引領(lǐng)。
華為顯然意識到了這一點,宣稱將把麒麟970作為人工智能移動計算平臺開放給更多的開發(fā)者和合作伙伴,提供完善的多應(yīng)用模式和機(jī)器學(xué)習(xí)框架的支持,讓開發(fā)者可以用自己最習(xí)慣的方式獲得麒麟970的AI算力。
對于人工智能的云+端布局而言,谷歌+蘋果的混合體或許是華為應(yīng)該學(xué)習(xí)的榜樣。
2、SoC芯片通信連接能力的提升不應(yīng)被AI掩蓋光芒
AI大熱下,通信不再是聚光燈下的焦點,但通信連接能力的提升不應(yīng)被輿論低估和遺忘。以麒麟970為例,10nm工藝、業(yè)界首款支持cat18的SoC,F(xiàn)DDLTE下儀表測試1.2Gbps下載速率、5CC(國內(nèi)尚看不到有需求,在頻譜更離散的區(qū)域有需求比如美國AT&T)、4X4MIMO與256QAM(媒體應(yīng)該相對熟悉了),放在以往都是大新聞,但是今年幾乎無人問津。
如果跳出移動AI芯片領(lǐng)域,在人工智能競爭戰(zhàn)場上,蜂窩連接芯片是英偉達(dá)們?nèi)局阜涓C智能終端領(lǐng)域蛋糕的最大障礙,自然也就是移動SoC芯片商的競爭壁壘。從這個角度看,未來智能終端SoC芯片的引領(lǐng)之爭,仍屬于蘋果(傳在進(jìn)行modem自研)、華為、高通們。
評論