大潮退去 人工智能還能走多遠(yuǎn)?
2017整整一年,圍繞人工智能的巨頭投資、創(chuàng)業(yè)押注不絕于耳,融資額度不斷刷新紀(jì)錄。但是無論是圖像、語言交互,還是算法、機(jī)器學(xué)習(xí)都不足以與實際場景結(jié)合,換句話說,落地成為最大的難題。
另一方面,越來越多新技術(shù)、新概念的出現(xiàn),也讓人工智能逐漸遇冷。2017下半年隨著比特幣的大漲,區(qū)塊鏈成為大家關(guān)注的新熱點,幾乎占據(jù)了投資人、媒體人的朋友圈。
講技術(shù) 卻找不到應(yīng)用場景
大家都知道人工智能代表著未來,但是在現(xiàn)實生活中,除了某些特定場景之外,大家?guī)缀鯚o法感受到人工智能帶來的便利。
舉個例子來說,智能音箱可以說是借著人工智能浪潮最先起來的產(chǎn)品之一,2017年一度呈現(xiàn)“百箱大戰(zhàn)”的局面,也是阿里、京東、小米等巨頭搶灘的要地,但是作為核心賣點之一的語音識別在體驗中并沒有大眾所期待的那樣優(yōu)秀。
首先,語音識別需要龐大的數(shù)據(jù)庫支持,但是當(dāng)我們真正使用時會發(fā)現(xiàn)有很多表達(dá)習(xí)慣并不能被機(jī)器所理解。雖然很多語音識別公司都說自己的技術(shù)識別率已經(jīng)到95%,甚至是98%,但是在方言、咬字、吞音等常見情況下,大部分產(chǎn)品都無法做出合理反饋。(感興趣的讀者可以查看IT耳朵評測文章,了解更多內(nèi)容)其次是聲音采集的準(zhǔn)確性,雖然智能音箱主打的場景是客廳和臥室,但是使用時場景是比較復(fù)雜的,人說話的聲調(diào)、語速等都不相同,采集聲音時會受到其他人員、環(huán)境雜音、甚至是音箱自身的干擾,這都會導(dǎo)致準(zhǔn)確率下降影響體驗。最后也最重要的是缺乏交互自然性。幾乎所有智能音箱產(chǎn)品都需要一個類似“芝麻開門”的語音密鑰來喚醒,且每次發(fā)布指令時都要重復(fù)一遍喚醒詞,這就讓用戶與產(chǎn)品之間產(chǎn)生明顯的距離。
綜合看來,智能音箱的產(chǎn)品形態(tài)確實足夠新穎誘人,但是其本質(zhì)還是一個語音助手,并不能完全勝任智能家居中控的角色。
另一個明顯的例子自動駕駛技術(shù)。大家習(xí)慣把自動駕駛分為L1-L5這五個等級,近期我們也采訪了一些自動駕駛(輔助駕駛)的公司,他們普遍認(rèn)為自己的技術(shù)還處在L3等級,即高度自動駕駛階段,在應(yīng)對激烈情況時仍需人為介入。而這樣的技術(shù)是如何實現(xiàn)的呢?
特斯拉對于周邊環(huán)境的識別是通過設(shè)置在車輛上的12個長距離超聲波距離傳感器Ultrasonic Sensors、1個長距離雷達(dá)Radar和1個前向攝像頭Forward-facing camera來實現(xiàn)的,而國內(nèi)其他公司的解決方案也都類似。但是通過長時間的走訪和觀察,我們也發(fā)現(xiàn)其中的一些問題,首先雷達(dá)或者超聲波是會相互干擾的,試想一下十幾輛車堵在路口,他們之間會形成強(qiáng)烈的干擾從而導(dǎo)致收集到的數(shù)據(jù)出現(xiàn)偏差。其次前向攝像頭也不是萬能的,想想微博上熱議的“遠(yuǎn)光狗”,想想繁華街市的各色霓虹燈,這些都是對攝像頭最大的挑戰(zhàn)。在一次與四維圖新自動駕駛研發(fā)部負(fù)責(zé)人聊天中,他也坦言,目前自動駕駛使用的攝像頭在弱光、逆光、或者多種光源的復(fù)雜環(huán)境下仍然很難準(zhǔn)確做出判斷,甚至在一些沒有道路標(biāo)志線和明顯路邊的地區(qū)也很難精準(zhǔn)識別。
人工智能在2017年發(fā)展最快的兩個典型案例中,表現(xiàn)都不能讓人滿意。再看看其他的應(yīng)用場景機(jī)器人、智慧物流、智慧城市似乎又離消費者太遠(yuǎn)。各大人工智能公司頻頻爆出融資消息,發(fā)布會也沒少開,但是卻很少聽見落地的案例。
玩概念 卻做不好體驗
如商湯、曠視、依圖、圖森這些國內(nèi)人工智能風(fēng)口上的企業(yè)大部分是做算法的,由于技術(shù)的商業(yè)化程度不足,往往只能通過項目定制的形式為客戶提供AI技術(shù)服務(wù),即簡單粗暴地賣模型、賣算法,如人臉識別技術(shù)服務(wù)、基礎(chǔ)語言識別服務(wù)、金融領(lǐng)域的知識圖譜工程等。但以人和算法作為企業(yè)核心能力是不可持續(xù)的,尤其目前深度學(xué)習(xí)領(lǐng)域的算法紅利期變得越來越短。
以面部識別為例,經(jīng)過iPhone X的教育,手機(jī)面部解鎖正在成為越來越多廠商的標(biāo)配。但是作為消費者來說98%的識別率和99%的識別率在體驗上幾乎沒有區(qū)別。而用過面部解鎖的用戶都知道,在移動(晃動)中無法解鎖才是其目前無法取代指紋解鎖主要原因。
商湯科技就曾聯(lián)合OPPO手機(jī),為旗下旗艦機(jī)R11s提供面部識別解鎖方案,但是經(jīng)過我們的實際測試,R11s除了能掃描人臉并解鎖外,我們竟然用一張一寸照片成功解鎖手機(jī),這其中的安全隱患有多大各位想一下。(感興趣的讀者可以查看IT耳朵評測文章,了解更多內(nèi)容)當(dāng)然智能手機(jī)的前置攝像頭采用什么樣的參數(shù)和防抖技術(shù)是人工智能解決方案公司無法控制的,所以出現(xiàn)這樣的體驗結(jié)果并不能完全怪方案提供商。
但換個角度想想,消費者可沒時間理解這技術(shù)背后的復(fù)雜程度,大家只會覺得面部解鎖這個技術(shù)不好用,慢慢的就會讓那些敢于嘗鮮的體驗者失去熱情,甚至不再接受這項技術(shù)。就像兩年前的VR市場,九塊九的VR設(shè)備的確讓更多人有了親身體驗VR的機(jī)會,但是也讓跟多人遠(yuǎn)離了VR,不是嗎?
搶人才 卻留不住人才
人工智能雖然出現(xiàn)已久,但是國內(nèi)這方面的專業(yè)人才并不多。根據(jù)億歐網(wǎng)發(fā)布的《億歐智庫:主要中國企業(yè)核心AI人才圖譜》顯示,218位人工智能華人高管里,知名大學(xué)相關(guān)專業(yè)畢業(yè)的博士生占85%,而這些人基本上涵蓋了國內(nèi)你能想到全部人工智能知名公司。
但是,有了這些人就能踏實搞好產(chǎn)品嗎?通過整理公開資料我們發(fā)現(xiàn):百度首席科學(xué)家吳恩達(dá)離職創(chuàng)立Deeplearning.ai;百度高級副總裁王勁離職成立景馳科技,專注于無人駕駛出租車技術(shù)方案研發(fā);云知聲CMO離職創(chuàng)辦人工智能教育公司先聲教育;商湯科技曹旭東離職后創(chuàng)辦自動駕駛公司Momenta;格靈深瞳的丁鵬博士離職創(chuàng)辦人工智能醫(yī)療公司DeepCare;英特爾的吳甘沙等5人離職創(chuàng)辦自動駕駛公司馭勢科技;樂視超級汽車副總裁倪凱單飛創(chuàng)辦禾多科技……
科大訊飛股份有限公司董事長劉慶峰曾公開表示“人工智能目前最需要的是人才,尤其是在行業(yè)應(yīng)用領(lǐng)域?!?/p>
可見人才對這個行業(yè)的重要性。幾乎每個成立三年以上的人工智能公司都會存在一次“團(tuán)隊出走,二次創(chuàng)業(yè)”的事件,也正是這些“釜底抽薪”事件的發(fā)生,導(dǎo)致很多公司在產(chǎn)品迭代上停滯不前。
根據(jù)數(shù)據(jù)報告顯示,目前人工智能企業(yè)更加青睞于有5年以上工作經(jīng)驗的中高端人才,且挖角的工資一般是現(xiàn)有工資水平的2-3倍。頂級人才離職創(chuàng)業(yè)、中高端人才被挖角已經(jīng)成為國內(nèi)人工智能行業(yè)普遍存在的現(xiàn)象。
大潮退去 人工智能還能走多遠(yuǎn)?
伴隨著比特幣的火熱,區(qū)塊鏈近來成為關(guān)注的新寵,大額融資事件也開始逐漸出現(xiàn),一時間大家茶余飯后都用“炒幣”作為談資。而炒作了一年的人工智能技術(shù),似乎遇冷了。
這里所說的“遇冷”并不是說行業(yè)的凋零,更多是指在一年間形成的行業(yè)格局。從資源的角度來說,過去的一年間國內(nèi)前50的人工智能企業(yè)幾乎拿到了市場上80%的融資,而由此帶來的資源高度集中是后來的創(chuàng)業(yè)者所無法企及的。從技術(shù)角度來看,語音識別、人臉識別、圖像處理、輔助駕駛等相關(guān)領(lǐng)域也已經(jīng)形成一超多強(qiáng)或者多超多強(qiáng)的局面,中小團(tuán)隊很難與之匹敵。從應(yīng)用角度來看,諸如商湯、云從等公司已經(jīng)和眾多伙伴展開合作,這背后的數(shù)據(jù)將是技術(shù)迭代的前提條件,又甩開那些只在實驗室中做研究的團(tuán)隊幾條街。這樣看來,拋開BAT、微軟、谷歌等頂級巨頭不談,單單是頭部的這些人工智能公司就已經(jīng)印證了所謂的“二八法則”,其他公司還能走多遠(yuǎn)?
當(dāng)下國內(nèi)整個人工智能公司的現(xiàn)狀是這樣的:首先,錢是有的,動不動就幾千萬上億的融資比比皆是;其次,人才是有的,上文已經(jīng)提到挖人才的現(xiàn)狀,另外很多公司也與知名高校合作共同培養(yǎng)人才;最后,技術(shù)是有的,據(jù)官方數(shù)據(jù)顯示語音的識別準(zhǔn)確率已達(dá)99%,圖像的識別率也在95%以上。但一年下來人工智能帶給我們的生活體驗卻寥寥無幾?
或許2018該是技術(shù)落地的一年,也是去偽存真的一年。
評論