和谷歌搶人,挖微軟墻角,F(xiàn)acebook AI實(shí)驗(yàn)室5年逆襲之路
堅(jiān)持5年能得到什么?
本文引用地址:http://m.butianyuan.cn/article/201812/395461.htm馬云說,“對于一家創(chuàng)業(yè)公司而言,能堅(jiān)持做5年,就一定是‘?!摹!?/p>
同理,對于一家傳統(tǒng)互聯(lián)網(wǎng)公司而言,能堅(jiān)持5年用新技術(shù)為原有業(yè)務(wù)改頭換面,更牛。
而從2013年12月10日對外正式宣布成立AI實(shí)驗(yàn)室FAIR至今,Facebook真真正正做AI正好5年時(shí)間了。這家在科技創(chuàng)新上素來以“落后、跟隨”之姿發(fā)展的公司,如今也正在期待著憑借AI再創(chuàng)互聯(lián)網(wǎng)社交傳奇。
傳統(tǒng)社交數(shù)據(jù)的爆發(fā)式增長
“沒有深度學(xué)習(xí),現(xiàn)在的Facebook就無法正常運(yùn)營,因?yàn)樗呀?jīng)深入到Facebook的方方面面了?!盕AIR創(chuàng)辦者&首席AI科學(xué)家、卷積神經(jīng)網(wǎng)絡(luò)發(fā)明者之一的Yann LeCun在總結(jié)Facebook這5年發(fā)展時(shí)說道,“但實(shí)際上,在2013年之前,F(xiàn)acebook高層并不贊同成立這個(gè)實(shí)驗(yàn)室?!?/p>
眾所周知,F(xiàn)acebook以傳統(tǒng)社交互聯(lián)網(wǎng)起家。而因初初創(chuàng)立時(shí),扎克伯格還是哈佛大學(xué)的一名學(xué)生,所以這個(gè)社交平臺(tái)一開始也只在哈佛大學(xué)的學(xué)生中被廣泛熟知。
得益于互聯(lián)網(wǎng)的快速發(fā)展,以及社交這一“有點(diǎn)就可擴(kuò)散至面”的特性,F(xiàn)acebook很快便成為了美國高校學(xué)生日常社交的常用工具。
隨著用戶范圍的擴(kuò)大、開辟廣告業(yè)務(wù)以及接入第三方服務(wù),到2009年年初,F(xiàn)acebook的用戶數(shù)就已超1.5億,用當(dāng)時(shí)扎克伯格的話說,“如果Facebook是一個(gè)國家,那么它將是世界上人口第八多的國家,比日本、俄羅斯和尼日利亞等國都多?!?/p>
但1.5億的用戶量和主要以圖片為信息承載的社交模式,顯然還不足以讓扎克伯格為數(shù)據(jù)優(yōu)化及處理憂心,而素來“后知后覺”的公司高層最關(guān)心也依舊是產(chǎn)品線的拓展。直到2013年的一次宴會(huì),這一現(xiàn)狀才有所改變。
其實(shí),F(xiàn)acebook并不是不重視技術(shù)的發(fā)展,只是真的很“后知后覺”。這點(diǎn),從歷年來的F8大會(huì)就可以窺見一二。
2007年,F(xiàn)acebook召開了第一屆F8大會(huì),推出了面向開發(fā)者的社交圖譜。次年,又推出了社交工具Facebook Connect。但實(shí)際上,這些只是基于Facebook現(xiàn)有業(yè)務(wù)所做的調(diào)整,而非技術(shù)創(chuàng)新性突破。
也因此,2009年的F8大會(huì)因沒有新進(jìn)展而停辦。
此后兩年時(shí)間里,雖然其做了多番調(diào)整,相繼推出了新社交插件、Timeline、開放式圖譜協(xié)議、圖譜API等。但依舊可以看出,這些技術(shù)及產(chǎn)品不具備創(chuàng)新改革的能力。
為此,2013年的F8大會(huì)再次停辦了,這對才上市不久的Facebook,是個(gè)不小的打擊。
相關(guān)數(shù)據(jù)統(tǒng)計(jì),到2013年年初,F(xiàn)acebook全球日活躍用戶數(shù)已然超過了6.5億。加之第三方服務(wù)、廣告業(yè)務(wù)、視頻直播、Instagram等產(chǎn)品線的發(fā)展,以及各產(chǎn)品間數(shù)據(jù)共享需求的增加,傳統(tǒng)互聯(lián)網(wǎng)技術(shù)儼然開始無法繼續(xù)支撐下去了。
而此時(shí),諸如谷歌、微軟、蘋果等同類互聯(lián)網(wǎng)公司,早已開始向科技公司轉(zhuǎn)型,如谷歌早在2010年就成立了谷歌X實(shí)驗(yàn)室,更是在2011年成立了谷歌大腦。而蘋果更是在2011年就推出了智能語音助理Siri,將機(jī)器語音學(xué)習(xí)從實(shí)驗(yàn)室?guī)У搅舜蟊姷纳钪小?/p>
此時(shí)的Facebook,顯然已經(jīng)落后了。
“Facebook CTO Mike Schroepfer此前一直不同意成立AI實(shí)驗(yàn)室,但事實(shí)顯示,AI對于Facebook未來發(fā)展越來越重要?!盠eCun回憶說,“在去扎克伯格家赴宴時(shí),我和他詳談了AI的重要性。幸運(yùn)的是,扎克伯格當(dāng)時(shí)也認(rèn)為‘開放創(chuàng)新’應(yīng)該成為Facebook發(fā)展的重點(diǎn)。”
“之后沒多久,F(xiàn)AIR就成立了。”
追趕深度學(xué)習(xí)
從成立之初,F(xiàn)AIR的定位便是一個(gè)負(fù)責(zé)研究技術(shù)的部門,其研究重點(diǎn)也大多聚焦在解決推理、預(yù)測、規(guī)劃、無監(jiān)督學(xué)習(xí)等底層技術(shù)問題上。
當(dāng)然,技術(shù)研發(fā)離不開人才,但Facebook于AI方面的積累幾乎為0。所幸,扎克伯格肯投入,除LeCun外,5年時(shí)間里,F(xiàn)AIR還相繼吸引來了包括VC維和SVM的締造者Vladimir Vapnik,提出隨機(jī)梯度下降法的Léon Bottou,做出高性能PHP虛擬機(jī)HHVM的Keith Adams、ICCV 2017最佳論文得主何凱明等在內(nèi)的多位深度學(xué)習(xí)頂級(jí)專家,甚至還用7位數(shù)年薪與Deepmind展開了搶人大戰(zhàn)以及大力挖角微軟。截止到目前,F(xiàn)AIR的團(tuán)隊(duì)規(guī)模就已擴(kuò)大至了近200人。
如此大的人才投入下去,成果自然也不會(huì)少。
· Caffe2
沿襲Caffe的大量設(shè)計(jì),2017年4月FAIR推出了兼具擴(kuò)展性、高性能和便攜性的Caffe2,一個(gè)輕量化和模塊化的深度學(xué)習(xí)框架,可在移動(dòng)設(shè)備上進(jìn)行訓(xùn)練和預(yù)測。
· PyTorch
2017 年初,F(xiàn)AIR發(fā)布了基于Python開發(fā)的PyTorch。因其集成了Caffe2和ONNX 的模塊化、面向生產(chǎn)的功能,提供從研究原型到生產(chǎn)部署的無縫路徑,并與云服務(wù)和技術(shù)提供商進(jìn)行深度集成,在GPU速度和內(nèi)存使用率方面都極具優(yōu)勢。
今年10 月,F(xiàn)acebook還舉辦了第一屆 PyTorch開發(fā)者大會(huì),來自加州理工學(xué)院、FAIR、fast.ai、谷歌、微軟、英偉達(dá)、特斯拉等多位行業(yè)頂級(jí)專家均有參與。
· FastText
為了加快機(jī)器文本分類和學(xué)習(xí)速度,2016 年FAIR推出FastText,可對數(shù)十億個(gè)單詞量文本進(jìn)行快速分類。截止到目前,F(xiàn)astText已經(jīng)可以對157 種語言的文本進(jìn)行分類,也被應(yīng)用于諸如“消息回復(fù)建議”等的場景中。除此之外,F(xiàn)astText還和DeepText相結(jié)合,進(jìn)行自然語言理解和翻譯。
· Fairseq機(jī)器翻譯模型
基于CNN,F(xiàn)AIR推出了集速度、準(zhǔn)確性和學(xué)習(xí)能力為一體的NMT神經(jīng)機(jī)器翻譯架構(gòu)——Fairseq,其速度較谷歌的RNN提高了9倍。
而為了避免需要翻譯大量的數(shù)據(jù)集(通常稱為語料庫),F(xiàn)AIR在去年發(fā)布了MUSE,通過監(jiān)督和無監(jiān)督式學(xué)習(xí)的方式,學(xué)習(xí)和翻譯110種雙語詞典以及自我構(gòu)建新的雙語詞典。
· bAbI
長期記憶能力不足是神經(jīng)網(wǎng)絡(luò)的缺陷之一,為此,F(xiàn)AIR開發(fā)了一個(gè)支持內(nèi)存網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)模型,它能夠參考此前的對話內(nèi)容做記憶性回答。比如,在學(xué)習(xí)了《魔界》這部電影的劇情后,其就能概括出故事的最后戒指是出現(xiàn)在了Mount Doom中。
而為了讓模型有足夠的數(shù)據(jù)學(xué)習(xí),F(xiàn)AIR還構(gòu)建了一個(gè)問答任務(wù)數(shù)據(jù)集——bAbI,包含數(shù)千個(gè)對話示例,可以提高模型理解文本的準(zhǔn)確性。
· Mask R-CNN
作為一個(gè)以圖片分享為核心的社交平臺(tái),每天上傳至Facebook上的圖片數(shù)據(jù)量是極為龐大的。而為了在合適的時(shí)間為用戶展示合適的圖片,F(xiàn)AIR通過理解圖片中的不同部分的像素,以理解圖片的特殊含義,比如分析人手部動(dòng)作的具體含義,實(shí)現(xiàn)圖像實(shí)例分割。
目前,Mask R-CNN已被應(yīng)用于檢測劣質(zhì)內(nèi)容等場景中。未來,F(xiàn)acebook還將會(huì)應(yīng)用它為AR、智能相機(jī)等業(yè)務(wù)賦能。
5年堅(jiān)持下的“煥新”
可以看到,5年時(shí)間,F(xiàn)acebook在AI,尤其是深度學(xué)習(xí)基礎(chǔ)技術(shù)研發(fā)上已初具規(guī)模。當(dāng)然,任何高端技術(shù)在走出實(shí)驗(yàn)室之前,都無法創(chuàng)造實(shí)際價(jià)值。為此,在FAIR技術(shù)成果轉(zhuǎn)化過程中,F(xiàn)acebook還成立了其第二大人工智能實(shí)驗(yàn)室AML,旨在研究AI技術(shù)的具體應(yīng)用。
一般而言,如這樣分成兩個(gè)部門應(yīng)該存在著很大的溝通交流問題,不過很顯然,F(xiàn)acebook在這方面做的很好。所有來自FAIR的預(yù)測推理、視覺、語義理解技術(shù)都被廣泛應(yīng)用到Facebook的各個(gè)產(chǎn)品中,如其圖片濾鏡已可以跟Snapchat媲美,不同用戶主頁News Feed上呈現(xiàn)的內(nèi)容是由機(jī)器圖像分析后決定的以及清除垃圾數(shù)據(jù)、內(nèi)容及郵件翻譯、智能攝像監(jiān)控、簡化版數(shù)字助理“M”等,都是AI賦能的結(jié)果。
而在Facebook近年大力發(fā)展的VR/AR業(yè)務(wù)方面,上述中多項(xiàng)技術(shù)都有所應(yīng)用。甚至還有消息稱,F(xiàn)acebook內(nèi)部已經(jīng)在緊鑼密鼓的研發(fā)語音助理,代號(hào)為 “Aloha”。
可以說,AI已經(jīng)成為了互聯(lián)網(wǎng)社交外,F(xiàn)acebook最核心的部分。從2014年開始,即便在今年遭遇重大數(shù)據(jù)泄露問題的情況下,F(xiàn)8大會(huì)再未出現(xiàn)停辦的情況,也或多或少都有較為亮眼的新產(chǎn)品或技術(shù)推出。Facebook也終于在2016年發(fā)布的“十年版圖”中,將AI、VR等技術(shù)放在了戰(zhàn)略核心的位置上。
就連那位此前一直反對成立人工智能實(shí)驗(yàn)室的Mike Schroepfer也終于承認(rèn),“AI是Facebook未來三大重點(diǎn)發(fā)展領(lǐng)域之一,其余兩個(gè)是虛擬現(xiàn)實(shí)和讓更多的人連上網(wǎng)絡(luò)?!?/p>
成果來之不易,堅(jiān)持更是難上加難。雖然較之于谷歌、微軟這樣在底層技術(shù)方面素來領(lǐng)先的公司而言,F(xiàn)acebook目前還未能有突破性領(lǐng)先成果,但5年時(shí)間里,F(xiàn)AIR的多項(xiàng)成果及相關(guān)應(yīng)用也足以說明,F(xiàn)acebook正在試圖,或者說期待憑借AI再創(chuàng)其在互聯(lián)網(wǎng)時(shí)代的社交傳奇。
就連LeCun都說,“在FAIR創(chuàng)辦之前,F(xiàn)acebook做的都是一些短期的工程項(xiàng)目,最長的項(xiàng)目周期也不過6個(gè)月?!庇纱丝梢云诖?,下一個(gè)5年,F(xiàn)AIR或許能給我們帶來更多的驚喜。
評(píng)論