智能手機AI的下半場 從扁平到立體
自去年以來,手機行業(yè)最熱的名詞必是“AI”無疑。AI,即人工智能,英文Artificial Intelligence,又稱機器智能(Machine Intelligence)。顧名思義,這是機器展現(xiàn)出來的智能,區(qū)別于人或動物的自然智能(Natual Intelligence)。
本文引用地址:http://m.butianyuan.cn/article/201811/394948.htm
AI作為一個新技術被世人知曉,可能是源于兩年前。彼時,谷歌的人工智能棋手“Alpha Go”戰(zhàn)勝圍棋世界冠軍李世石而一戰(zhàn)成名,人們開始了解到AI并寄予這項技術更多的遐想:AI是否是生產(chǎn)力革命的下一個“風口”?而在科技行業(yè)中,嗅覺靈敏的手機行業(yè)當然希望牢牢抓住AI這一風口,將這一技術由前端科研下放到消費電子領域,應用到智能手機終端。AI終究更快地走入了人們的生活。
目前看來,AI在智能手機上的應用,分為上半場和下半場。
上半場:
自2017年9月2日首款AI手機芯片麒麟970芯片正式發(fā)布,支持到硬件級的AI能力進入到手機行業(yè),正式開啟智能手機AI化的上半場。在這個時間區(qū)間內(nèi),手機的應用主要是各個手機廠家在推動,零散,分裂,水平參差不齊。由于手機廠商的研發(fā)投入與技術底蘊各不相同,自然對AI的真實性與可用性也不一而足。
時至今日,AI技術已經(jīng)從理論開始產(chǎn)品化實踐,進而向消費電子領域全面普及。在手機行業(yè)中,上至旗艦,下到千元機,無論是拍照還是玩游戲,整個行業(yè)渴望搶食AI紅利,乃至AI手機從擁有技術底蘊的公司辛勤研發(fā)的“風口”變成哪怕不具備能力的廠家希望能靠營銷上位的“風噪”。
首先是華為、蘋果等廠商,憑借專門的AI硬件與軟件的配合實現(xiàn)了完成度較高的AI功能,促進了行業(yè)的發(fā)展和進步。例如華為在硬件上采用麒麟970/980等具有獨立NPU的AI芯片,軟件上通過集成了AI識別場景、AI翻譯等功能的EUMI系統(tǒng)來實現(xiàn)AI功能,方便了用戶的使用。在過去的一段時間里,似乎安卓陣營只有華為和榮耀有底氣講自己的產(chǎn)品是名副其實的AI手機。
另一方面,有一些廠家,則單單憑借一些軟件算法,就稱自己的手機為“AI手機”,甚至一些千元機,也是張口閉口“AI拍照”“AI游戲”。但歸根結底,他們鮮有技術積累,遑論實現(xiàn)真正的AI功能,自然無法讓用戶感覺到手機變得更加智能;甚至在一定程度上加大了手機行業(yè)營銷過度的“風噪”聲量。
那么這里就引入一個問題,所謂的“手機AI”,到底是什么呢?
簡單來說,手機AI就是用專門的AI芯片識別特定場景并針對性地完成任務。具體的實現(xiàn)原理則是以AI芯片對神經(jīng)網(wǎng)絡模型進行深度學習,進而在自然語義理解,圖像識別等場景下工作。
可以理解為,AI的本質(zhì)是運算,當前手機芯片AI運算解決方案主要以獨立處理單元體現(xiàn)。其中獨立處理單元則是在手機處理器中加入深度學習專用處理器IP。我們熟知的傳統(tǒng)處理器和圖形處理器一般是面向特定部分的應用,不具有向深度學習方面的優(yōu)化計算能力。而專門進行AI計算的專用處理器則能夠顯著提升深度學習的處理速度和能效,提升能效比。
目前在端側,手機AI最常解決的場景在人臉識別、物體識別、圖像分割、智能翻譯等場景。舉個例子,你在使用手機拍照時,手機能自動識別藍天、人像、動物這些具體場景,從而針對不同場景進行不同優(yōu)化,都是圖像識別、圖像分割這些看似“高端”的技術的落地。而對于AI,其性能也并非“看不見摸不著”。而在蘇黎世聯(lián)邦理工學院的AI Benchmark測試中,麒麟980獲得了目前安卓手機中的No:1。而在比較經(jīng)典的AI測試場景中,蘋果A12 Bionic每秒能識別6000張照片。
因此,在近半年發(fā)布的A12 Bionic、麒麟980,以及三星Exynos9820中都加入了獨立的神經(jīng)網(wǎng)絡處理單元,主流移動芯片廠商對于自家的旗艦終端芯片,標志著上游供應鏈已經(jīng)完成了硬件上對AI的支持。(在下個月高通發(fā)布的8150中,據(jù)說也會搭載獨立NPU)
從華為開創(chuàng)移動端人工智能芯片的先河,到如今幾乎所有的主流旗艦級芯片都加入硬件級AI的支持。如果說單個手機廠家自己做AI只是自發(fā)的行為,以致于各家所能實現(xiàn)的AI水平參差不齊;那么全體芯片廠商從上游的芯片供應來推動手機AI的發(fā)展,就使得硬件級AI將覆蓋未來幾乎所有的高端旗艦智能手機。至此,智能手機AI的上半場告一段落。
下半場:從扁平到立體
盡管得到了上游芯片廠商的支持,但也只是標志著手機AI軍備競賽的下半場將正式開始。因為當大家在硬件層面都處在同一起跑線的時候,競爭會變得多樣化。
如果說手機AI 1.0是二維平面,單純依靠智能手機的終端硬件——AI芯片來在端側實現(xiàn);那么如今手機AI 2.0的時代業(yè)已成為一種三維的通路:面對日益復雜的AI工作場景,需要從芯片、終端再到云端進行協(xié)作運算。在這方面,華為的HiAI平臺則跑在了前面。
首先,芯片硬件的AI算力是實現(xiàn)AI功能的物質(zhì)基礎,AI算力的強弱決定了智能手機執(zhí)行AI任務的速度。
以風靡全球的Prisma軟件為例。作為第一款結合了人工智能技術的濾鏡軟件,一經(jīng)問世便走紅全球,它的特點在于將用戶的照片賦予梵高的《星空》等經(jīng)典大作的風格。其實現(xiàn)原理就是AI中的“卷積神經(jīng)網(wǎng)絡”學習,在用戶選擇要添加藝術濾鏡的原照片后,Prisma軟件便開始了“物體識別--紋理合成--風格提取--圖片合成”這一系列的工作流程,這其中最難的工作就是物體識別。
在一張集成了錯綜復雜的線條、色彩與光影的照片中,如何較為精準地區(qū)分出物體的輪廓?這就回到了卷積神經(jīng)網(wǎng)絡技術,通過不斷的訓練與學習,一步步地對目標圖片中物體進行“篩選”和“過濾”,最后就會得到較為清晰的物體輪廓,進而用算法生成與經(jīng)典畫作一樣風格的照片。因此在進行AI任務,如用Prisma軟件修圖時,擁有不同AI算力的智能手機表現(xiàn)也會有顯著的差距。華為麒麟980等集成獨立NPU單元的Soc對于卷積神經(jīng)網(wǎng)絡運算的支持更加到位,這是由于卷積神經(jīng)網(wǎng)絡在運算時需要進行大量的并行計算。相比依賴CPU等進行AI運算的芯片,具有獨立NPU的芯片有著4倍的速度與僅僅1/50的功耗。
其次,AI功能的落地離不開軟件的支持。華為在軟件上打造了一個完成度非常高的AI閉環(huán)。從打開手機開始,用戶可以使用系統(tǒng)層面的智能情景助手和智能語音助手小藝;打開相機,可以用AI攝影大師進行場景識別并自動優(yōu)化拍攝參數(shù);打開AI識物可以識別食物的卡路里、搜索看到的商品或者進行即時翻譯,等等……用戶隨時隨地都在使用著真實可感的AI服務。
另外,隨著對于復雜AI工作場景的不斷開發(fā),必然要實現(xiàn)終端(智能手機)到云端(服務器)的協(xié)同計算。因為硬件本身的算力畢竟是有限的,只有借力于云端服務器,才能實現(xiàn)更好的AI運算。
譬如當用戶將鏡頭對準一只不知其種類的小狗,終端和云端的AI接力開始。終端芯片憑借NPU迅速地識別鏡頭下小狗的各種特征,首先識別出它是一只狗,但可能儲存在手機內(nèi)部的算法并不知道具體是一只什么狗。此時云端存儲的不同品種小狗的特征進行對比和校驗,最后在屏幕上顯示出小狗的準確種類讓用戶了解,這只是一個很小的AI協(xié)同工作的場景,但舉一反三,未來在手機會做出更多令人期待的功能。
因此在華為HiAI 2.0中,開發(fā)了基于 “芯、端、云”三層AI生態(tài),HiAI Foundation芯片能力、HiAI Engine應用能力與HiAI Service服務能力,以芯、端、云結合的三層開放能力滿足開發(fā)者的各種需求。在未來,更多成熟的AI應用一定是有賴于完善的AI計算與開發(fā)平臺。打通芯片(硬件)—系統(tǒng)及APP(軟件)—云端(計算)這一完整的通路,才能實現(xiàn)更好的AI功能。
總結:
如今的智能手機行業(yè)顯然已經(jīng)到了一個關鍵的十字路口。處理器性能的單純提高和硬件上的進化,在過去的十年里充當了這個行業(yè)主要的任務,而在這些基礎性能之上,如今AI已經(jīng)成為智能手機通向未來的一把鑰匙,在算力和數(shù)據(jù)的馬太效應之下,會加速智能手機AI的進化速度。對于智能手機來說,隨著上游芯片廠商的推動,AI的上半場已經(jīng)逐漸塵埃落定,而下半場,哨音已響。
評論