蘋果、華為接連入局,移動AI芯片成為競爭新焦點
近期,蘋果發(fā)布A11Bionic神經引擎、華為發(fā)布麒麟970集成NPU,端側人工智能成為業(yè)內熱點,高門檻的人工智能一夜間要飛入尋常百姓家了,對于智能手機人工智能我們應該抱有怎樣的期待呢?
本文引用地址:http://m.butianyuan.cn/article/201711/371030.htm正在被輿論泡沫化的人工智能其實剛上路
隨著互聯網+的大潮/光環(huán)/紅利的退潮,市場、產業(yè)、投資都需要新熱點。人工智能被稱為是未來十年的熱點,是受益于計算能力、大數據集、深度神經網絡領域都在取得了超乎尋常的進步,人工智能類新興技術在Gartner2017新興技術成熟度曲線上快速移動。
一個危險的信號是市場幾乎到了不談AI就是落伍的地步,人工智能投資和輿論正在泡沫化。適度的泡沫利于新興技術的快速普及與商用化,但當一個概念被熱炒天花亂墜后,最大的危機在于不落地用戶可感知性不強。
每個廠商都在談自己的手機人工智能了,云山霧繞,但更多是只聞樓梯腳步聲,對于最終消費者而言,也許只是其中的一點(畢竟人工智能的范疇太廣),亦或是僅僅是停留在宣傳上再包裝的換湯不換藥。
畢竟,屬于人工智能的時代才剛剛開始。
端側人工智能面臨挑戰(zhàn),但也有獨特優(yōu)勢,專用硬件AI芯片成為優(yōu)選
現階段AI計算主要通過深度學習來進行,分為訓練和推斷兩類。訓練主要是云端訓練是根據已知數據尋找模型參數的過程,主要依賴于云端海量數據與復雜神經網絡結構,計算量巨大。由于端側缺乏大規(guī)模數據,暫缺乏端側模型訓練。而在云端與終端側均可進行推斷,推斷是根據已有模型,對具體某個應用(圖片、語音、翻譯等)在云端/終端側進行判斷(大量矩陣運算),并返回結果。
云端AI芯片路線基本確立,GPU用于訓練,FPGA用于推斷,谷歌另辟蹊徑開發(fā)ASIC(TPU)可同時完成訓練和推斷。端側AI芯片則根據不同的終端類型,有著不同解決方案,GPU、FPGA、ASIC、NPU(SoC中AIASIC)等都有應用。
相比云端訓練及推斷的蓬勃發(fā)展,端智能確實相對滯后,主要受制于手機側的計算性能,智能手機無論是體積、供電、散熱和能耗等方面相比云端服務器計算,在支持AI方面面臨著巨大的挑戰(zhàn)。
但是相對于云端的人工智能來說,智能終端側部署人工智能在隱私保護、帶寬需求、實時性/低延時、功耗以及體驗等眾多方面又都更有優(yōu)勢。
手機SoC芯片既要不斷追求最好的性能,同時對每一個能力的加入又必須用最高的性能密度和最好的能源效率的方式進行,這對芯片的設計提出了超高的要求。
考慮到前述功耗、帶寬、性能、可靠性、安全和延遲方面因素,用硬件來實現機器學習和深度學習,相比軟件+云計算方案更有優(yōu)勢,神經網絡處理成為人工智能手機SoC的關鍵處理單元是必然趨勢,如同CPU、GPU、音視頻編解碼器一樣,在智能終端側部署人工智能已經是大勢所趨
移動AI芯片成為競爭新焦點,華為、蘋果目前領先半個身位,2018年則可能遍地開花
人工智能芯片可以稱為芯片發(fā)展史上的又一次專業(yè)分化,當初GPU也是這么走過來的,主要目標仍是縮短計算時間、降低計算能耗。
ARM
在年初發(fā)布針對人工智能及機器學習進行優(yōu)化的DynamIQ技術,實現了在單一計算集群上進行大小核配置,對每一個處理器進行獨立的頻率控制以及開、關、休眠狀態(tài)的控制,可以實現在不同任務間高效無縫切換最合適的處理器。將加入針對人工智能的指令集和優(yōu)化庫,下一代ARMV8.2版本的指令集將支持神經網路卷積運算,提升通用SoC芯片的人工智能和機器學習的效率。
最近,英國ImaginaTIon發(fā)布了最新神經網絡加速器PowerVR2NXNNA,相信ARM的專用AI芯片IP大概率會在2018年面世。
高通
高通在2016年發(fā)布Zeroth平臺時發(fā)布了神經處理引擎SDK包,支持主流的深度學習框架Caffe、TensorFlow等。同時,高通收購荷蘭機器學習初創(chuàng)公司Scyfer,投資神經科學初創(chuàng)公司BrainCorp,不斷強化人工智能方面的布局。在華為、蘋果相繼推出專用AI芯片單元后,高通旗艦芯片實現AI能力硬化是必然,據傳高通已經開始設計制造執(zhí)行神經網絡的專用芯片,焦點可能在于高通是自研還是用哪家的IP。
MTK
據傳,聯發(fā)科已完成了手機芯片內置AI運算單元的設計,預計2018年上市的HelioP70芯片將內建神經網絡及視覺運算單元(NeuralandVisualProcessingUnit,NVPU)。
蘋果
蘋果iPhone8系列中應用的A11Bionic應用處理器,引入神經網絡處理引擎(NE,NeuralEngine),面向特定機器學習算法,處理支持新iPhone中3DSensor、人臉識別解鎖、Animoji等功能。
華為
麒麟970設計了HiAI移動計算架構,首次集成NPU(NeuralNetworkProcessingUnit)專用硬件處理單元,其AI性能密度大幅優(yōu)于CPU和GPU,基于AI實現智能場景識別與對象識別并進行針對性優(yōu)化,提升用戶拍照效果。
可以大膽推測,在2018-19年,旗艦智能手機支持專用AI芯片是大概率事件,能力具備了,但這并不意味著智能手機就真正到了愿景中的人工智能階段。業(yè)內又在尋找基于深度學習的殺手級APP出現,其實也許這就是個偽命題,拍照、面部識別等現有應用體驗的優(yōu)化,更有資格成為首批AI受益應用。
SoC集成專用AI芯片大幅提升計算能力,但移動端AI體驗仍任重而道遠
傳統(tǒng)CPU、GPU和DSP本質上并非以硬件神經元和突觸為基本處理單元,相對于NPU在深度學習方面天生會有一定劣勢,在芯片集成度和制造工藝水平相當的情況下,理論上表現將遜色于NPU。
據華為官方宣稱,麒麟970相較于四個Cortex-A73核心,在處理同樣的AI應用任務時,新的異構計算架構擁有大約25倍性能和50倍能效優(yōu)勢。以圖像識別速度為例,麒麟970可達到約2005張/分鐘。
嚴格意義上講,現階段我們或許并不應該期待人工智能產生全新的應用,更多應該期待的是通過人工智能技術,讓現有的應用效率更高、能效更低、體驗更好。目前最成熟的兩個AI應用領域是語音識別和圖像識別,而蘋果和華為的專用AI芯片也均選擇在兩個領域進行突破,提升用戶最常用應用的體驗。
圖像識別:華為的AI+慧眼、蘋果的FaceID解鎖
拍照現在用戶最關注的體驗,通過AI提升體驗是個感知度高的選擇。華為麒麟970通過AI實現拍照過程中場景識別、對象識別然后進行智能優(yōu)化。場景識別比如運動場景、夜間環(huán)境等,提升優(yōu)化運動場景下的定格清晰度與暗光拍照效果。對象識別比如人臉識別,針對不同膚色、帽子、眼睛、口罩、遮擋、側臉等多種復雜的人臉場景進行智能檢測,針對性的改善人臉部信息的色彩和補光、人臉追焦的優(yōu)化等。相當于把已有的專業(yè)級拍照模型(知識庫)通過AI芯片應用于用戶的拍照過程中,而無需再去學習專業(yè)的拍照技能。
iPhoneX在圖像識別方面的面部識別解鎖極具炫耀性體驗,終端側基于結構光方案建立用戶臉部3D數據,解鎖比對通過A11芯片中的神經網絡模塊神經引擎(NeuralEngine)進行處理。
語音識別:AI降噪提升語音識別率、siri升級版
麒麟970A芯片I降噪是通過應用人工智能噪聲模型替換傳統(tǒng)的反相技術消噪模型,抑制非穩(wěn)態(tài)噪音,增強語音信號,把高速、車內噪聲大環(huán)境下的語音識別率從80%提升到92%(華為實驗室官方數據)。
作為普及人工智能的啟蒙應用,siri居功至偉,在新iPhone發(fā)布會上,Siri相比前幾代也有明顯的提升,想必也用到了蘋果機器學習博客中提到的新AI技術,并進一步擴展siri的服務能力。
其他的AI應用體驗,諸如,照片應用的圖像識別,相冊歸類;聽歌推薦,通過對用戶聽歌記錄的學習來調整作出相應的推薦;智能回復/推薦,基于云端知識庫預測用戶的信息回復與情緒表達;續(xù)航優(yōu)化,基于用戶使用行為的機器學習進行調整電池管理等,都是實用性很強的AI體驗。
顯然,人們對于人工智能手機的期望不只是這些。整體而言,人工智能技術是一種基礎能力屬于使能層,集成專用AI芯片,突破的是性能瓶頸,而未來的AI體驗仍將是應用場景驅動。無論是模型還是知識庫還是基于AI應用,都有賴于生態(tài)合作,有賴于第三方應用開發(fā)者調用AI芯片開放的能力進行開發(fā),進而發(fā)揮AI芯片的算力。
展望未來,移動芯片的引領制勝法寶則是人工智能、5G兩翼齊飛不瘸腿
1、AI芯片成功的關鍵是人工智能應用生態(tài)的構建
華為與蘋果幾乎同時推出專用AI處理單元芯片,考慮到18個月的芯片設計周期,需要給華為麒麟芯片點贊。SoC芯片集成專用AI芯片堪稱端側人工智能里程碑,并有望快速普及,但只是人工智能的第一步,遠談不上勝利,我看到的更多是挑戰(zhàn)。
未來AI芯片的競爭,不僅僅取決于芯片廠商自身的技術研發(fā),更取決于生態(tài)運作能力包括垂直領域的知識庫/模型合作以及第三方應用開發(fā)者,看誰的生態(tài)能夠提供的應用更豐富、體驗更好。對于華為而言,挑戰(zhàn)更甚于當初在基帶領域的單點突破到不斷引領。
華為顯然意識到了這一點,宣稱將把麒麟970作為人工智能移動計算平臺開放給更多的開發(fā)者和合作伙伴,提供完善的多應用模式和機器學習框架的支持,讓開發(fā)者可以用自己最習慣的方式獲得麒麟970的AI算力。
對于人工智能的云+端布局而言,谷歌+蘋果的混合體或許是華為應該學習的榜樣。
2、SoC芯片通信連接能力的提升不應被AI掩蓋光芒
AI大熱下,通信不再是聚光燈下的焦點,但通信連接能力的提升不應被輿論低估和遺忘。以麒麟970為例,10nm工藝、業(yè)界首款支持cat18的SoC,FDDLTE下儀表測試1.2Gbps下載速率、5CC(國內尚看不到有需求,在頻譜更離散的區(qū)域有需求比如美國AT&T)、4X4MIMO與256QAM(媒體應該相對熟悉了),放在以往都是大新聞,但是今年幾乎無人問津。
如果跳出移動AI芯片領域,在人工智能競爭戰(zhàn)場上,蜂窩連接芯片是英偉達們染指蜂窩智能終端領域蛋糕的最大障礙,自然也就是移動SoC芯片商的競爭壁壘。從這個角度看,未來智能終端SoC芯片的引領之爭,仍屬于蘋果(傳在進行modem自研)、華為、高通們。
評論