對話胡郁:AI現(xiàn)狀與科大訊飛的機(jī)會(huì)
編者按:科大訊飛副總裁、研究院院長胡郁在GMIC大會(huì)期間參加了閉門媒體見面會(huì),機(jī)器之心有幸獲邀參加。這是胡郁首次公開面對媒體詳細(xì)介紹科大訊飛和深入分析人工智能行業(yè)。機(jī)器之心曾經(jīng)翻譯過IEEE Spectrum對Yann LeCun的專訪,此次現(xiàn)場與胡郁交流,感覺他與LeCun的風(fēng)格非常像,同樣是技術(shù)天才,同樣有著出色的口才和思路,能將非常復(fù)雜的人工智能問題和行業(yè)現(xiàn)狀講的異常清晰和透徹。
轉(zhuǎn)自《機(jī)器之心》
一、人工智能再次火爆的原因:天時(shí)地利人和的三要素人工智能的研究歷史可謂幾經(jīng)周折,經(jīng)歷了四次寒冬。而如今又再次變得異?;馃幔瑢W(xué)術(shù)界、產(chǎn)業(yè)界和媒體界都對該領(lǐng)域表達(dá)了廣泛關(guān)注。深度學(xué)習(xí)大師GeoffreyHinton、Yann LeCun和吳恩達(dá)分別被科技巨頭谷歌、Facebook和百度招致麾下;高校研究機(jī)構(gòu)紛紛推出自己的人工智能最新研究進(jìn)展;眾多以DeepMind、Vicarious 為代表的眾多人工智能創(chuàng)業(yè)公司開始興起,行業(yè)自身的發(fā)展加上媒體的大肆宣傳使這個(gè)行業(yè)得到了前所未有的熱度和關(guān)注。
對于胡郁來說,人工智能一下子火起來是有原因的,核心算法、數(shù)據(jù)量的增長和應(yīng)用模式這三個(gè)方面的成熟為人工智能的發(fā)展提供了天時(shí)地利人和的環(huán)境,因此,人工智能開始從技術(shù)上突破了產(chǎn)業(yè)上大規(guī)模應(yīng)用的瓶頸。同時(shí),不管是語音識別,還是圖像識別,這些人工智能技術(shù)基本都是在同一時(shí)間發(fā)生了大的變化和突破,這些都和以下三個(gè)要素有關(guān),有共性的東西。
1)核心算法的提升第一方面是深度神經(jīng)學(xué)習(xí)為代表,基于統(tǒng)計(jì)模型的整體突破,這個(gè)方向被研究了幾十年,只有在這方面真正掌握一流的人才才能抓住這樣的機(jī)會(huì)。深度神經(jīng)網(wǎng)絡(luò)(DNN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)就是可以很好提升圖像識別和語音識別能力的核心算法。2)大數(shù)據(jù)現(xiàn)在人工智能在很多方面是基于統(tǒng)計(jì)模型,統(tǒng)計(jì)模型里非常重要的就是你要有足夠多的能符合我們真實(shí)世界的數(shù)據(jù)樣本。以前在實(shí)驗(yàn)室環(huán)境下很難收集足夠多的樣本,現(xiàn)在數(shù)據(jù)容量相對以前在數(shù)量、覆蓋性和全面性方面都獲得了大幅提升,現(xiàn)在所獲得數(shù)據(jù)量更大,更加多維,同時(shí)覆蓋更全面。因此,對這些海量數(shù)據(jù)的處理能力就非常重要,需要有超級計(jì)算機(jī)還有海量存儲等工程技術(shù)體系的支撐。目前,科大訊飛和百度都擁有這樣的數(shù)據(jù)收集和處理能力。3)應(yīng)用模式的建立現(xiàn)在與以往實(shí)驗(yàn)室技術(shù)最大的不同在于,把研究技術(shù)、工程、產(chǎn)品、應(yīng)用、最終用戶整個(gè)鏈條打通,形成了大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算和智能化的整個(gè)循環(huán)。這是一個(gè)不斷迭代優(yōu)化的過程,讓每個(gè)用戶在使用這個(gè)技術(shù)同時(shí)也成為數(shù)據(jù)的貢獻(xiàn)者和經(jīng)驗(yàn)的分享者。他們在使用過程當(dāng)中會(huì)碰到哪些問題,我們再改進(jìn)。這種優(yōu)化能力是一個(gè)系統(tǒng)化工程,是互聯(lián)網(wǎng)公司和訊飛這樣的公司,在互聯(lián)網(wǎng)有很多方面的積累之后才能做到的。這也是為什么以前研究所和學(xué)校很難做到。這三點(diǎn)具有普適性,用在圖像、語音都可以,是一個(gè)把人才、計(jì)算能力以及整合鏈條建立起來,并將最終用戶的數(shù)據(jù)不斷優(yōu)化的整套體系,這是工業(yè)界的人工智能,要想突破大規(guī)模應(yīng)用就必須具備這三個(gè)天時(shí)地利人和基本要素。而且這三個(gè)要素也是互相補(bǔ)充,比如說有了移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)帶來了大數(shù)據(jù),還要有相應(yīng)的算法和工程人員,這不是靠一個(gè)產(chǎn)品概念能解決的,這個(gè)部分需要科學(xué)家和工程師一起研究的。
面對「為何人工智能能夠再次振興」這個(gè)老生常談的問題,百度吳恩達(dá)曾將人工智能比喻成火箭,其中數(shù)據(jù)是燃料,算法是發(fā)動(dòng)機(jī),人工智能這個(gè)火箭升空需要這兩者的配合。LeCun和Hinton等深度學(xué)習(xí)倡導(dǎo)者們也都表示,計(jì)算能力的增強(qiáng)以及數(shù)字?jǐn)?shù)據(jù)爆炸將會(huì)再次推動(dòng)深度學(xué)習(xí)研究的發(fā)展,而這些將共同促進(jìn)人工智能的發(fā)展。胡郁給出的答案與這些觀點(diǎn)類似,都提到了數(shù)據(jù)和算法的重要性,但同時(shí)又提到了應(yīng)用模式這個(gè)要素,這能體現(xiàn)出他在產(chǎn)業(yè)界的深厚積累。
而對于科大訊飛來說,首先,其「訊飛語音云」覆蓋終端用戶數(shù)超過6億,日語音服務(wù)量超到1億次,開放云平臺的應(yīng)用項(xiàng)目8萬多個(gè),這將為科大訊飛提供源源不斷的數(shù)據(jù)。其次,科大訊飛在核心算法方面一直具有優(yōu)勢,同時(shí)技術(shù)基因決定了他們將繼續(xù)重視對核心算法的研究。最后,科大訊飛把自己定位成以核心技術(shù)驅(qū)動(dòng)的產(chǎn)品提供商,有自己的業(yè)務(wù)方向,同時(shí)也作為開放式平臺進(jìn)行多個(gè)業(yè)務(wù)方向和應(yīng)用場景的嘗試??梢?,科大訊飛在算法、數(shù)據(jù)和應(yīng)用場景結(jié)合方面有著深厚的積累,同時(shí)這也為科大訊飛后續(xù)人工智能領(lǐng)域的發(fā)展提供了堅(jiān)實(shí)基礎(chǔ)。
人工智能是一個(gè)嚴(yán)重依靠頂尖專家和人才的領(lǐng)域,我們在市場上經(jīng)常能看到谷歌、百度等科技巨頭激烈的人才爭奪,從深度學(xué)習(xí)元老到名校畢業(yè)生,再到斥巨資收購人工智能創(chuàng)始團(tuán)隊(duì)。而在這方面,位于中國安徽的科大訊飛略顯低調(diào),很少能看到他們大張旗鼓的人才引進(jìn)計(jì)劃,但在胡郁介紹完科大訊飛獨(dú)特且科學(xué)的人才引進(jìn)和建設(shè)體系后,著實(shí)令人欽佩。
1)專家、學(xué)生和研究人員的良好互動(dòng)胡郁表示,人才分為幾種,有一部分人才是高校的研究負(fù)責(zé)人,他們比較高瞻遠(yuǎn)矚,但不大可能離開學(xué)校加入到公司。第二是非常優(yōu)秀的畢業(yè)的學(xué)生,他們在老師的帶領(lǐng)下做研究工作,畢業(yè)后不會(huì)留在學(xué)校里。第三種人才就是真正進(jìn)入到科大訊飛研究院的高端人員??拼笥嶏w一直跟高校合作,首先就要和具有前瞻性眼光、最有業(yè)界影響力的教授建立起合作關(guān)系,比如說香港中文大學(xué)的湯曉歐教授,他們的圖像識別和人臉識別技術(shù)在國際上處于領(lǐng)先位置,哈爾濱工業(yè)大學(xué)的劉挺教授,他們的自然語言處理技術(shù)也是處于研究領(lǐng)域的領(lǐng)先水平。還有西北工業(yè)大學(xué)的陳景東教授,他們在自己所研究的點(diǎn)上可能是世界上最好的。他們并不做實(shí)際的產(chǎn)品,也缺乏上面講到的大數(shù)據(jù)、大環(huán)境優(yōu)化以及在整個(gè)產(chǎn)業(yè)中與最終用戶打通的能力。而這對于科大訊飛來說是原來自然體系一個(gè)延伸,是很自然的事情。其次是與這些專家的學(xué)生進(jìn)行合作,學(xué)生跟他的老師相比沒有那么全面,但是都在做最前沿、最新的東西??拼笥嶏w會(huì)支持這些學(xué)校里的學(xué)生做風(fēng)險(xiǎn)性大、嘗試性的產(chǎn)品,失敗不要緊,學(xué)生是培養(yǎng)出來的。學(xué)生跟科大訊飛在合作過程中就建立比較深的合作關(guān)系以及個(gè)人關(guān)系,包括一些對產(chǎn)業(yè)的認(rèn)識等。這些學(xué)生畢業(yè)之后最優(yōu)秀的一部分人會(huì)進(jìn)入到科大訊飛研究院,這時(shí)候因?yàn)樗呀?jīng)嘗試過很多,或者失敗過很多,積累了豐富的經(jīng)驗(yàn),因此就可以迅速滿足產(chǎn)業(yè)上的最新需求,研發(fā)一些風(fēng)險(xiǎn)比較小、容易出成果的東西。將胡郁的觀點(diǎn)總結(jié)下來,科大訊飛的人才機(jī)制就是通過和高校等研究機(jī)構(gòu)合作,在老師、學(xué)生和研究人員之間形成一種良好的互動(dòng)和協(xié)作機(jī)制。老師和行業(yè)專家負(fù)責(zé)把握大方向,學(xué)生進(jìn)行風(fēng)險(xiǎn)性較高的研究嘗試,公司研究人員負(fù)責(zé)面向最終產(chǎn)品的風(fēng)險(xiǎn)較低、較確定性的研發(fā)工作。2)人才戰(zhàn)略的國際化科大訊飛就是一家系統(tǒng)創(chuàng)新公司,通過三個(gè)途徑實(shí)現(xiàn)人才的國際化。第一,找國際上這個(gè)領(lǐng)域最好的專家給你指導(dǎo)。比如說貝爾實(shí)驗(yàn)室的語音組在聲學(xué)技術(shù)、聲學(xué)建模和解碼算法方面都是世界上最強(qiáng)的,當(dāng)時(shí)的負(fù)責(zé)人是李錦輝教授,科大訊飛很早就和他們建立了關(guān)系。第二,科大訊飛要把人派到國際知名研究機(jī)構(gòu)中去,無論是學(xué)生還研究人員,進(jìn)入這個(gè)環(huán)境里面培養(yǎng)。這些人要長期穩(wěn)定的做,他們一定是既懂公司的需求,又能接觸到世界最先進(jìn)的東西。第三,積極進(jìn)行國際交流,一定要參加這個(gè)領(lǐng)域的專業(yè)會(huì)議,在這些會(huì)議上真正看到人工智能核心的東西,比如真正解決智能難題的重點(diǎn)算法等等??拼笥嶏w就是通過這三種方式培養(yǎng)跟國際水平相當(dāng)?shù)囊慌?,他們?huì)扎扎實(shí)實(shí)做技術(shù),并將很多的核心技術(shù)點(diǎn)整合起來,形成高水平的系統(tǒng)創(chuàng)新。
胡郁詳細(xì)介紹了科大訊飛的業(yè)務(wù)布局,這主要分成兩部分,第一是通用的人工智能技術(shù)和平臺級業(yè)務(wù),科大訊飛將語音識別、自然語言處理能力授權(quán)給第三方,或者與其他公司進(jìn)行合作,比如說移動(dòng)互聯(lián)網(wǎng)和智能家居企業(yè)等。這些技術(shù)將成為貫穿多個(gè)行業(yè)的底層技術(shù)服務(wù)。第二是科大訊飛自己將人工智能技術(shù)與優(yōu)勢產(chǎn)業(yè)相結(jié)合,比如近期的重點(diǎn)業(yè)務(wù)——互聯(lián)網(wǎng)教育。胡郁用微軟做了類比,Windows操作系統(tǒng)是微軟的通用技術(shù),而Office是微軟自己重點(diǎn)開展的某個(gè)特定方向的業(yè)務(wù),而互聯(lián)網(wǎng)教育就相當(dāng)于科大訊飛的「Office」產(chǎn)品。
1)智能化互聯(lián)網(wǎng)教育胡郁首先對目前的互聯(lián)網(wǎng)教育行業(yè)進(jìn)行了解釋,他認(rèn)為人們沒有把信息化和智能化分清楚。其實(shí)應(yīng)該有三個(gè)步驟,首先你要數(shù)字化,能解決很多問題。錄音筆就數(shù)字化了,原來搞的磁帶你就受不了,因?yàn)槟鞘悄M的。第二步,數(shù)字化之后是信息化,用軟件就可以做到。信息化是把數(shù)字表示的信息連接在一起,原來人做的事情,現(xiàn)在信息化系統(tǒng)就可以做很高效。電腦是信息化設(shè)備不是智能化設(shè)備。第三階段就是當(dāng)信息化到了一定程度之后,數(shù)據(jù)大到一定程度之后,可以做一些比較聰明比較智能的事情。以教育中的閱卷為例,數(shù)字化把卷子變成計(jì)算機(jī)里可以看到的東西,信息化把卷子收集在一起,處理起來不用紙了,可以通過網(wǎng)絡(luò)傳輸,通過手機(jī)可以看,這是數(shù)字化和信息化。智能化就是有了這些信息之后可以自動(dòng)幫你改卷子,自動(dòng)評判你說話的流利程度,還有你答題的正確程度,還有就是知道你哪道題答錯(cuò),知道你哪些題不會(huì),從而可以給你補(bǔ)習(xí)。現(xiàn)在老師比較頭疼就是改卷子的問題,高考有一個(gè)頑疾就是必須在規(guī)定時(shí)間內(nèi)把卷子改完,很多人知道改的有問題,但沒辦法解決。還有就是沒辦法改口語考試,因?yàn)樾枰獙<襾砺牎5F(xiàn)在通過智能化的手段,口語也可以用機(jī)器改,改的跟專家一樣。科大訊飛就是在信息化基礎(chǔ)上做到了人工智能,訊飛超腦還有教育超腦,這個(gè)東西能夠幫助解決在學(xué)校、老師,家長和學(xué)生他們之間面臨的一系列痛點(diǎn)和難點(diǎn)問題。用機(jī)器來進(jìn)行自動(dòng)口語閱卷,目前在廣東高考還有部分地區(qū)的中考都已經(jīng)實(shí)現(xiàn)。以前只能改選擇題、填空題,問答題和作文等主觀題沒法改,科大訊飛正在做一些主觀改進(jìn),做到作文題都可以改。原來是兩個(gè)老師評,看兩個(gè)人的分差,現(xiàn)在把其中的一個(gè)人換成機(jī)器,如果跟機(jī)器之間發(fā)現(xiàn)分差比較大,再讓一個(gè)人改,這樣可以降低一半的工作量。更重要的是,機(jī)器是不斷學(xué)習(xí)的,機(jī)器隨著學(xué)習(xí)的東西越來越多,算法不斷進(jìn)步,數(shù)據(jù)越來越多,總有一天它就比人改的好。機(jī)器自動(dòng)閱卷屬于教學(xué)評價(jià),科大訊飛智能化的互聯(lián)網(wǎng)教育還包括課堂教學(xué),公司有一整套的解決方案,比如大家都知道有一個(gè)電子白板,課堂上可以讓老師更加方便的來教學(xué),這是屬于信息化的部分。坦白來講,一定要把信息化和智能化結(jié)合在一起,科大訊飛的系統(tǒng)里面會(huì)融合一些智能化的工作。比如說對于老師講課的過程會(huì)全部記錄下來,用智能化的方法給他分析,有一些好的課堂知識點(diǎn)可以給他進(jìn)行分享,快速的查閱和檢閱,并對學(xué)生的課堂表現(xiàn)進(jìn)行自動(dòng)評價(jià)和打分。還有就是家庭學(xué)習(xí),這有點(diǎn)像其他互聯(lián)網(wǎng)教育公司提供的搜題答題工具,也可以講它是人工智能的一個(gè)應(yīng)用。但科大訊飛正在做的要更深一點(diǎn),是要能夠真正培養(yǎng)一個(gè)懂知識點(diǎn)的「老師」,不僅告訴學(xué)生答案,還能告訴他推理過程和解題邏輯,并根據(jù)學(xué)生的答題情況進(jìn)行個(gè)性化輔導(dǎo)。這需要多種技術(shù)點(diǎn)的整合,關(guān)鍵點(diǎn)在于要幫助學(xué)生真正提高學(xué)習(xí)成績(而非完成作業(yè)),幫他解決個(gè)性化的學(xué)習(xí)問題。在教育方面,胡郁還提到了科大訊飛正在牽頭研發(fā)的高考機(jī)器人,這個(gè)系統(tǒng)自己學(xué)習(xí)書本知識,幫學(xué)生解答問題,給學(xué)生的不僅是最終答案,還有告訴他這道題目怎么解?,F(xiàn)在可以看到的系統(tǒng)都是用搜索的方法做,這個(gè)題以前出過是可以找出來答案,但是題變一個(gè)參數(shù)就找不到答案,而現(xiàn)在正在研發(fā)的系統(tǒng)是告訴他們解題思路的,新的題目也可以自己分析出來。查閱科大訊飛近期的公告發(fā)現(xiàn),該問答機(jī)器人是科大訊飛作為總牽頭單位所承擔(dān)的「863計(jì)劃」類人智能項(xiàng)目,其聯(lián)合清華、北大、復(fù)旦、哈工大、中科院自動(dòng)化所、軟件所等全國30多家高校和科研機(jī)構(gòu),集結(jié)了國內(nèi)超過60%的人工智能專家,研發(fā)最終能通過高考的類人答題機(jī)器人,這將為本項(xiàng)目提供針對教育領(lǐng)域的高級認(rèn)知智能的全新支撐。科大訊飛董事長劉慶峰此前也表示,問答機(jī)器人是「訊飛超腦計(jì)劃」的重要組成部分,未來要讓機(jī)器人參加高考,并且可以考上重點(diǎn)院校,甚至是清華、北大、科大。他說,讓機(jī)器考及格很簡單,因?yàn)闄C(jī)器有著極強(qiáng)的記憶能力,而讓它考高分則有難度,涉及到讓機(jī)器具備推理和學(xué)習(xí)能力,一旦成功,這將會(huì)是一個(gè)巨大突破。如胡郁所說,目前絕大部分互聯(lián)網(wǎng)教育公司都是處于教育信息化,或者是初級智能化階段,只是提高了消息流通效率,并沒有提供更多智能化的服務(wù),而教育本身就是一個(gè)需要強(qiáng)大智力支持的領(lǐng)域,單靠數(shù)字化和信息化根本無法達(dá)到好的教育效果,也無法真正滿足用戶的個(gè)性化教育需求。而從另一方面來講,眾多擁有人工智能技術(shù)的科技巨頭和創(chuàng)業(yè)公司并沒有將該技術(shù)應(yīng)用于互聯(lián)網(wǎng)教育方向。科大訊飛恰恰是將這兩者結(jié)合在了一起,如胡郁所說,這兩方面要平衡,人工智能技術(shù)和應(yīng)用層面的需求要同等重視。這將幫助科大訊飛在互聯(lián)網(wǎng)教育領(lǐng)域?qū)崿F(xiàn)重大突破??拼笥嶏w在教育領(lǐng)域已經(jīng)取得了眾多成績,在語音評測方面,科大訊飛是唯一經(jīng)過國家語委權(quán)威鑒定,并在全國31省市普通話等級考試中全面使用的技術(shù),英語口語評測系統(tǒng)在廣東、江蘇、廣西、重慶等10余省市的中高考英語考試中實(shí)施。語音合成方面,已經(jīng)連續(xù)9屆獲得Blizzard Challenge國際合成大賽冠軍,是唯一超過普通人發(fā)音水平、符合中小學(xué)課堂教學(xué)要求的技術(shù)。中英口語翻譯方面,科大訊飛超腦計(jì)劃的口語翻譯獲得了2014國際口語機(jī)器翻譯評測比賽英漢口語雙向翻譯第一名,完勝美國麻省理工學(xué)院、日本國家通信技術(shù)研究所、香港科技大學(xué)、英國愛丁堡大學(xué)等世界一流高校和機(jī)構(gòu)。此外,科大訊飛在全國中高考數(shù)據(jù)中心年閱卷數(shù)量超過1億份。而科大訊飛在互聯(lián)網(wǎng)教育的發(fā)力還剛剛開始,近期公布的定增計(jì)劃中有18億將投入「智慧課堂及在線教學(xué)云平臺項(xiàng)目」。這包括教育資源平臺、課堂教學(xué)軟硬件產(chǎn)品、教學(xué)質(zhì)量測評與分析系統(tǒng)和基于大數(shù)據(jù)分析的在線學(xué)習(xí)系統(tǒng)。
2)開放平臺和對外合作業(yè)務(wù)胡郁表示,除了科大訊飛自身的重點(diǎn)項(xiàng)目互聯(lián)網(wǎng)教育之外,科大訊飛還與第三方合作或提供技術(shù)服務(wù)。在這方面,科大訊飛重點(diǎn)關(guān)注的領(lǐng)域是移動(dòng)互聯(lián)網(wǎng)(包括訊飛輸入法和靈犀)、智能家居、電信運(yùn)營商智能語音服務(wù)、智能車載系統(tǒng)、政府便民工程。比如說在運(yùn)營商的音樂業(yè)務(wù)中幫助用戶識別歌曲;為政府的信息化和便民工程提供支持,利用大數(shù)據(jù)和人工智能的技術(shù)將政府很多內(nèi)部數(shù)據(jù)打通,讓市民辦理一些政府業(yè)務(wù)時(shí)更加高效,比如原來辦理護(hù)照花很長時(shí)間,現(xiàn)在只需要原來很短的時(shí)間就可以做到。還有為智能家居和車載系統(tǒng)提供語音交互方面的技術(shù)支持。與第三方合作是通過「科大訊飛云平臺」來實(shí)現(xiàn)的,第一,這是一個(gè)平臺級產(chǎn)品,它為科大訊飛的語音能力向各個(gè)行業(yè)的輸出提供一種方式。原來是采用軟件授權(quán)的方式,但這無法獲得最終用戶的使用情況,也無法對其進(jìn)行優(yōu)化,效果無法提升。而采用云計(jì)算技術(shù)之后,可以不停地對技術(shù)服務(wù)做各種各樣的提升。第二,這是一個(gè)很好的創(chuàng)新實(shí)驗(yàn)平臺,科大訊飛自身可能并不知道語音應(yīng)用在哪些地方用,用的好還是用的不好。但有了這個(gè)平臺之后,科大訊飛就知道上面的各種應(yīng)用用的的好不好,有什么缺點(diǎn),并進(jìn)行很好的完善。在這個(gè)過程當(dāng)中科大訊飛可以得到相當(dāng)多的有價(jià)值的數(shù)據(jù),雖然這些數(shù)據(jù)可能還無法馬上體現(xiàn)出價(jià)值,但從長遠(yuǎn)角度來講是非常值錢的。在與第三方合作中,廣受大家關(guān)注的可能是今年3月份科大訊飛與京東簽署投資合作協(xié)議,雙方擬共同投資1.5億元設(shè)立訊京信息科技有限公司,聯(lián)手在智能家居和語音技術(shù)領(lǐng)域展開全面合作。胡郁表示,這個(gè)項(xiàng)目的目標(biāo)是要做一個(gè)標(biāo)桿出來,以填補(bǔ)現(xiàn)有市場上的空白??拼笥嶏w將自身在人工智能核心技術(shù)方面的優(yōu)勢跟京東整個(gè)家電的影響力和渠道方面的影響力結(jié)合在一起,旨在打造一款真正有標(biāo)桿性的東西。這里的技術(shù)問題很多,科大訊飛正在集中解決這些問題。關(guān)于產(chǎn)品形態(tài),胡郁說這是一個(gè)和智能家居相關(guān)的產(chǎn)品,很快就會(huì)出來。
3)訊飛超腦科大訊飛近期的定增計(jì)劃中有3.5億人民幣是投入到「訊飛超腦」項(xiàng)目,根據(jù)其公告,科大訊飛在其已有的人工智能核心技術(shù)基礎(chǔ)上,開展「訊飛超腦」項(xiàng)目研究, 突破新一代人工智能在語言理解、知識表示、邏輯推理和自主學(xué)習(xí)方面的認(rèn)知智能技術(shù)體系。整個(gè)項(xiàng)目包括關(guān)鍵技術(shù)研究、云平臺開發(fā)、數(shù)據(jù)資源及眾包平臺建設(shè)的相關(guān)軟硬件設(shè)備。胡郁也對「訊飛超腦」進(jìn)行了更加具體的解釋,他說:現(xiàn)在逐漸可以把人工智能的思路梳理出來,首先要回答人工智能是什么的問題,回答人工智能什么時(shí)候能夠突破的問題,還有人工智能怎么突破的問題。人工智能現(xiàn)在處于什么樣的階段?從廣泛的概念上來講,現(xiàn)在任何一個(gè)公司都可以講是人工智能公司,只要它用一些和人工智能領(lǐng)域相關(guān)的算法。但是像訊飛這樣能夠把人工智能講的如此清楚,知道自己明確的目標(biāo)并將人工智能真正應(yīng)用到自身的優(yōu)勢產(chǎn)業(yè)方向的并不多?!赣嶏w超腦」是訊飛公司面向人工智能領(lǐng)域開展的重大技術(shù)攻關(guān)項(xiàng)目,目標(biāo)是支撐訊飛公司的核心技術(shù)研發(fā)從感知智能階段延伸拓展到認(rèn)知智能階段,幫助科大訊飛實(shí)現(xiàn)從讓任意設(shè)備「能聽會(huì)說」到「能理解會(huì)預(yù)測」的技術(shù)跨越。在訊飛超腦項(xiàng)目上,我們有非常明確的目標(biāo)導(dǎo)向,同時(shí)還有清楚的路徑和實(shí)現(xiàn)方式,包括我們怎樣去做,哪些人去實(shí)現(xiàn)等等。總結(jié)下來,訊飛超腦應(yīng)該是一整套綜合的人工智能實(shí)現(xiàn)路徑和解決方案,這和胡郁所說的科大訊飛是一家「系統(tǒng)創(chuàng)新」公司的理念非常吻合。
當(dāng)被問到如何看待科大訊飛與國內(nèi)一些科技公司在人工智能領(lǐng)域的競爭時(shí),胡郁表示,他們不是競爭關(guān)系,而是合作關(guān)系,人工智能領(lǐng)域的公司幾乎不存在競爭關(guān)系。胡郁認(rèn)為科大訊飛和百度是要共同推進(jìn)中國在人工智能領(lǐng)域工業(yè)界落地的進(jìn)展。沒有任何公司會(huì)在人工智能領(lǐng)域進(jìn)行競爭,大家更多的是合作關(guān)系,共同推動(dòng)人工智能這個(gè)東西的共同的良性的發(fā)展。公司真正的競爭是落在行業(yè)層面。所以,科大訊飛并不擔(dān)心別人的技術(shù)超越自己,除非對方是技術(shù)提供商,訊飛剛開始時(shí)是提供技術(shù)的公司,會(huì)跟其他提供技術(shù)的公司進(jìn)行正面PK。但現(xiàn)在的訊飛已經(jīng)成為一家以核心技術(shù)驅(qū)動(dòng),通過最終的實(shí)用產(chǎn)品來解決用戶需求的公司。比如說教育、政府的信息化、車載、移動(dòng)互聯(lián)網(wǎng)和安全領(lǐng)域等等,如果存在競爭的話,是在這些方面展開競爭。還有一個(gè)存在競爭的層面就是人才的競爭。
訊飛最關(guān)心兩個(gè)問題,第一,科大訊飛在自身需要的人工智能核心技術(shù)領(lǐng)域是世界上最先進(jìn)的。第二,在公司具有優(yōu)勢的業(yè)務(wù)領(lǐng)域,自己的人工智能技術(shù)能夠發(fā)揮作用??拼笥嶏w選擇的教育、移動(dòng)互聯(lián)網(wǎng)、智能家居、車載以及和京東的合作,都需要人工智能技術(shù)來保障業(yè)務(wù)創(chuàng)新。胡郁希望中國做人工智能的公司越來越多,這樣人才也越來越聚集。但是對于當(dāng)前中國信息產(chǎn)業(yè)領(lǐng)域的人工智能公司,大家需要一起發(fā)出更大的聲音,向政府或者是廣大用戶正確的闡述當(dāng)前工業(yè)界可以實(shí)現(xiàn)人工智能的目標(biāo)和路徑,這對于培育整個(gè)市場是有好處的,可以把整個(gè)大的勢頭建立起來,對于中國正在這個(gè)領(lǐng)域確立在國際上的地位也非常重要??拼笥嶏w要聯(lián)合百度以及其他創(chuàng)業(yè)公司一起去把這個(gè)目標(biāo)實(shí)現(xiàn)好。
1)一家通用人工智能公司我們對科大訊飛的認(rèn)識可能是其擁有出色的語音識別技術(shù),當(dāng)被問到科大訊飛的技術(shù)研發(fā)時(shí),胡郁表示科大訊飛是一家綜合的人工智能公司 科大訊飛原來是做語音,語音是人工智能的一部分,除了語音合成和語音識別之外,科大訊飛還有圖像識別、聲音認(rèn)證和指紋識別等等,現(xiàn)在也在圍繞認(rèn)知智能方面的研究希望可以實(shí)現(xiàn)突破(能理解知識、進(jìn)行推理和自主學(xué)習(xí)的智能系統(tǒng))。在具體研發(fā)上,科大訊飛不僅自己做,在一些潛在性方向還會(huì)跟世界上最好的研究院所和單位一起合作。公司原來做語音時(shí)是和中國科學(xué)技術(shù)大學(xué)和清華大學(xué)進(jìn)行合作。做語言技術(shù)我們跟哈爾濱工業(yè)大學(xué)還有西北大學(xué)有很緊密的合作關(guān)系。在圖像識別方面現(xiàn)在跟香港中文大學(xué)的湯曉歐教授合作,但這些研究者缺少上面講到的大數(shù)據(jù)、大環(huán)境優(yōu)化以及在整個(gè)產(chǎn)業(yè)中與最終用戶打通的能力。而這對于科大訊飛來說是有條件有基礎(chǔ)的,從而能夠很好的實(shí)現(xiàn)產(chǎn)學(xué)研深入合作。2)基因決定了對核心技術(shù)的持續(xù)投入任何公司都要盈利,評判一個(gè)公司財(cái)務(wù)能力是非常重要的,關(guān)鍵還是它賺錢之后用來干什么。賺錢只是當(dāng)前的階段,比如你的市值很高,你獲得這么高市值之后,你得到很多利潤之后,你會(huì)往哪個(gè)方向做。有的公司選擇繼續(xù)資本投資,也有很多偉大的公司就是這樣。有的公司說繼續(xù)做市場,進(jìn)入更多領(lǐng)域。有的公司去開發(fā)更多產(chǎn)品。而訊飛的基因就是如果賺錢了,還會(huì)繼續(xù)投入到人工智能等核心技術(shù)研發(fā)上,哪怕它還要很長時(shí)間才能取得下一步的收益,這是基因決定的。3)科大訊飛的目標(biāo)科大訊飛有三個(gè)明確的目標(biāo),第一是促進(jìn)人機(jī)之間和人人之間信息溝通無障礙;第二是為了少年兒童的健康快樂成長;第三是為了國家信息安全和民族文化傳播。我們希望通過技術(shù)創(chuàng)新的方式并結(jié)合好的商業(yè)模式做到這一點(diǎn)。這是大家比較看好訊飛的原因。最后,胡郁用一句話總結(jié)了科大訊飛的未來愿景,科大訊飛是在人工智能領(lǐng)域靠技術(shù)創(chuàng)新來不斷獲得用戶價(jià)值和市場價(jià)值這么一家公司。
1)產(chǎn)業(yè)界關(guān)心現(xiàn)實(shí)問題,關(guān)心如何用現(xiàn)有技術(shù)解決用戶需求胡郁在上文中提到了目前人工智能再次爆發(fā)的天時(shí)地利人和,他重點(diǎn)強(qiáng)調(diào)了產(chǎn)業(yè)界不關(guān)心那些虛無縹緲的問題,比如大家討論人工智能是不是要?dú)缛祟?,這在短期內(nèi)不是產(chǎn)業(yè)上應(yīng)該關(guān)心的重點(diǎn)。大家都注意到了一些AI威脅論,那都是有錢有閑人的事情。即便把人工智能這個(gè)技術(shù)突破了,它不會(huì)有自己的意識情感,也不會(huì)考慮到危害還是不危害人的情況。我們現(xiàn)在連它最基本的認(rèn)知、知識掌握還沒解決。從科學(xué)家嚴(yán)謹(jǐn)?shù)慕嵌葋砜?,十年之?nèi)能不能解決還不確定。因此,我們應(yīng)逐步推進(jìn),根據(jù)現(xiàn)在的技術(shù)水平反過來設(shè)計(jì)我的產(chǎn)品,多去考慮一下在現(xiàn)在技術(shù)情況下,我們的產(chǎn)品可以解決大家什么問題。比如在酒店里面,你們住一個(gè)酒店,你要操縱酒店里的燈和服務(wù)是在一個(gè)可控的受限環(huán)境中,現(xiàn)代技術(shù)通過某種工程的優(yōu)化還有部分的自學(xué)習(xí)可以滿足大家的需求,不要幻想它一定那么智能。從科學(xué)家的角度來講,我們不停的研究新方法,從產(chǎn)品的角度來講,你現(xiàn)在有什么技術(shù),我如何避免它的缺點(diǎn),如何利用它的優(yōu)點(diǎn)做成用戶可以接受的產(chǎn)品,這兩條路要并行。胡郁提倡關(guān)注人工智能的現(xiàn)實(shí)問題,這基本代表了產(chǎn)業(yè)界的共同心聲。不論媒體多么喜歡追逐馬斯克和霍金等人的夸張言論并大肆宣傳,產(chǎn)業(yè)界依然在關(guān)注現(xiàn)實(shí)問題,關(guān)注現(xiàn)有技術(shù)進(jìn)展,關(guān)注如何將現(xiàn)有技術(shù)轉(zhuǎn)化成滿足用戶需求的具體產(chǎn)品。Jordan Pearson曾在文章中指出,馬斯克科幻作品般的言論被大肆炒作和宣傳,當(dāng)這樣的負(fù)面宣傳涉及到具體的研究工作時(shí),會(huì)產(chǎn)生非常消極和有害的后果。Facebook人工智能實(shí)驗(yàn)室的負(fù)責(zé)人YannLeCun去年在Google+上總結(jié)到:「一些不實(shí)宣傳對于人工智能是非常危險(xiǎn)的。在過去的50年里,人工智能就先后因?yàn)椴粚?shí)宣傳而沉淪了四次。關(guān)于人工智能的炒作必須停止。」2)大腦模擬是一個(gè)值得嚴(yán)肅討論的路徑,但不適合產(chǎn)業(yè)界通過模擬人腦的生理原理以實(shí)現(xiàn)人工智能是一個(gè)長期主題,控制論奠基人沃爾特·皮茨早在上世界四五十年代就進(jìn)行這樣的研究,用人造神經(jīng)網(wǎng)絡(luò)來模擬人類大腦,他的論文《邏輯演算》影響了馮諾依曼現(xiàn)代計(jì)算機(jī)架構(gòu)的提出。但皮茨卻在后續(xù)的研究中發(fā)現(xiàn)這條路根本走不通。如今,這條通往人工智能的路徑依然被學(xué)術(shù)界討論,只是沒有得到產(chǎn)業(yè)界的承認(rèn)。Yann LeCun在接受IEEE采訪時(shí)表示,他最不喜歡的對「深度學(xué)習(xí)」的描述就是「它像大腦一樣工作」,雖然深度學(xué)習(xí)從生命的生物機(jī)理中獲得靈感,但它與大腦的實(shí)際工作原理差別非常非常巨大。將它與大腦進(jìn)行類比給它賦予了一些神奇的光環(huán),這種描述是危險(xiǎn)的,這將導(dǎo)致天花亂墜的宣傳,大家在要求一些不切實(shí)際的事情。胡郁也認(rèn)為,對人腦進(jìn)行模擬這條路徑被國際很多人很嚴(yán)肅討論,但現(xiàn)在不是產(chǎn)業(yè)界走的路,是研究界或者是科學(xué)界走的路,那條路有可能,但不適合當(dāng)前產(chǎn)業(yè)界急需的人工智能突破。比如說HBP(歐盟人腦計(jì)劃)和美國人腦計(jì)劃,它們更多是研究腦生理,針對的是大腦疾病,順帶帶個(gè)尾巴提出了人腦模擬這個(gè)角度,后來有人把它延伸出來說可以通過腦模擬的方法實(shí)現(xiàn)人工智能。3)科技公司對人工智能的共識和區(qū)別胡郁表示,產(chǎn)業(yè)界對于人工智能的觀點(diǎn)基本能夠達(dá)成共識,就是他之前提出的三要素,算法、數(shù)據(jù)和應(yīng)用。而區(qū)別在于將人工智能技術(shù)應(yīng)用于何種方向,自身擅長哪些產(chǎn)品。谷歌和美國其他大公司第一是基于以深度神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)算法,基于數(shù)學(xué)這套東西。第二是基于大數(shù)據(jù)處理,第三就是基于產(chǎn)業(yè)一體化。以應(yīng)用反過來對產(chǎn)品、技術(shù)、研究進(jìn)行整體的迭代和優(yōu)化。這個(gè)思路上我們跟百度大腦有共識,我們都遵循,包括跟谷歌做的整個(gè)一套體系都是一樣。這是工業(yè)界實(shí)現(xiàn)人工智能的路徑。但是真正你要講從這路徑出來真正攻克什么領(lǐng)域,大家的目標(biāo)根據(jù)自己的產(chǎn)業(yè)優(yōu)勢就可能不一樣。谷歌和百度使用人工智能來解決的問題主要包括搜索、廣告、推薦、地圖和自動(dòng)駕駛汽車等,他們有這樣的資源??拼笥嶏w和他們在人工智能的實(shí)現(xiàn)路徑一樣,但目標(biāo)不太一樣,科大訊飛更多關(guān)注在感知智能和認(rèn)知智能,想突破機(jī)器怎么掌握人類知識這一點(diǎn),并將這些成果應(yīng)用到智慧教育,政府智能信息化,智能家居,智能車載等等領(lǐng)域。4)從感知智能到認(rèn)知智能胡郁在此前其他的演講中就提到過,人工智能主要分為計(jì)算智能、感知智能、認(rèn)知智能。感知智能方面包括語音識別、手寫識別和圖像識別等,認(rèn)知智能的目標(biāo)是需要在語言理解、知識表示、聯(lián)想推理和自主學(xué)習(xí)四個(gè)方面實(shí)現(xiàn)突破。此次胡郁又從技術(shù)角度對認(rèn)知智能的實(shí)現(xiàn)進(jìn)行了解釋。感知智能是圖象識別、語音識別,認(rèn)知智能我們還有一段距離,學(xué)習(xí)能力還有對知識掌握的能力,是我們現(xiàn)在需要努力突破的地方。5)人工智能新方法的優(yōu)勢在傳統(tǒng)人工智能方法下,我們首先要人工建立一個(gè)龐大的數(shù)據(jù)庫,然后再進(jìn)行推理。而隨著大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)的發(fā)展,現(xiàn)在嘗試用新的方法做。解釋的簡單一點(diǎn),就是用一些連續(xù)的概率統(tǒng)計(jì),把詞和詞之間的關(guān)系用一種數(shù)學(xué)方法描述出來。大家都知道給你們一組詞,「男人」和「女人」,「國王」和「王后」,如果按傳統(tǒng)的方法來看,「國王」是個(gè)男的,「王后」是女的。「國王」和「王后」的差別跟「男人」和「女人」的差別是一樣?,F(xiàn)在有一種新的方法,是看「國王」和「皇后」這兩個(gè)詞語在所有文本中出現(xiàn)的情況,他跟誰比較接近,他干哪些事情,干了哪些動(dòng)作,在所有文本描述里面周圍的環(huán)境是不一樣的。它能夠用一種概率統(tǒng)計(jì)的方法對「國王」和「王后」這些詞語周圍環(huán)境進(jìn)行概率描述,算出來之后發(fā)現(xiàn)跟「男人」和「女人」周圍環(huán)境的概率是非常強(qiáng)的相關(guān)關(guān)系。這時(shí)候就可以推倒出「「國王」減「王后」」等于「「男人」減「女人」」,并不是真正的建立那個(gè)體系,而是分析了「國王」和「王后」在各個(gè)地方出現(xiàn)的情況和「男人」和「女人」在各個(gè)地方出現(xiàn)的情況總結(jié)出來的。這種新方法能否成功還不確定,但谷歌、Facebook、微軟等都在做這方面的東西,想在新的體系下看能不能找到新的方式。也許兩到三年內(nèi),知識表達(dá)解決了,自然理解也解決了,邏輯推理也完成了。形成這個(gè)東西之后,機(jī)器就可以自動(dòng)去學(xué)習(xí)了。還有一點(diǎn)是,原來我們傳統(tǒng)的系統(tǒng)不是按照這種學(xué)習(xí)方式設(shè)計(jì)的。我們在實(shí)驗(yàn)室里編好程序,然后再放到真實(shí)環(huán)境中去用。用戶怎么反饋我不管(也看不到),我們只按照實(shí)驗(yàn)室里一套去我行我素。比如說,春節(jié)期間網(wǎng)傳的山東大漢與安吉星的對話視頻,當(dāng)司機(jī)糾正了所說號碼后,安吉星依然在自說自話,沒有根據(jù)用戶的反饋進(jìn)行相應(yīng)調(diào)整。其實(shí)如果機(jī)器了解關(guān)于這個(gè)司機(jī)的反饋信息并進(jìn)行模型思考的話,這樣的錯(cuò)誤就不會(huì)發(fā)生,但系統(tǒng)沒有學(xué)習(xí)到這些信息。之前的系統(tǒng)建設(shè)缺乏這樣的環(huán)境,而現(xiàn)在的思路是轉(zhuǎn)變?yōu)?,一開始這個(gè)系統(tǒng)是不聰明的,但用了之后可以觀察用戶的反饋,從用戶反饋中提取信息,包括你系統(tǒng)的評價(jià),告訴你哪個(gè)地方不好,系統(tǒng)學(xué)習(xí)這些東西從而逐步變得聰明,這需要新思路和新方法解決這些問題。以前我們沒條件做這個(gè)事情,現(xiàn)在我們有條件了。比如說DeepMind發(fā)布的那個(gè)能夠自動(dòng)玩游戲的人工智能系統(tǒng),它是自己去運(yùn)行那個(gè)游戲,執(zhí)行一些動(dòng)作,再根據(jù)死的快不快、得多少分進(jìn)行強(qiáng)化學(xué)習(xí)。研究這種方法是一個(gè)系統(tǒng)科學(xué),每一個(gè)點(diǎn)的實(shí)現(xiàn)都需要一個(gè)團(tuán)隊(duì)。必須掌握最先進(jìn)的技術(shù),把一個(gè)問題定義成一個(gè)可解決工程和科學(xué)問題,還要想出算法優(yōu)化它,這需要一個(gè)完整的團(tuán)隊(duì),有學(xué)生做高風(fēng)險(xiǎn)嘗試,還要有研究人員把可行的方案做起來。整個(gè)鏈條上需要這樣的人來組合。如果能解決這些問題,讓機(jī)器具有認(rèn)知智能才有可能實(shí)現(xiàn)。? THE END
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。