不止Alexa和AWS,揭秘亞馬遜人工智能發(fā)展史
《連線》雜志近日刊文,介紹了深度學(xué)習(xí)技術(shù)如何賦能Alexa和AWS,以及亞馬遜內(nèi)部的幾乎所有部門。
本文引用地址:http://m.butianyuan.cn/article/201802/375360.htm以下為騰訊科技編譯整理的文章概要:
2014年初,斯里坎斯·希魯梅拉(Srikanth Thirumalai)面見亞馬遜CEO杰夫·貝索斯(Jeff Bezos)。希魯梅拉是一名計(jì)算機(jī)科學(xué)家。他于2005年從IBM離職,成為亞馬遜商品推薦團(tuán)隊(duì)的負(fù)責(zé)人。這一次,他提出了一項(xiàng)全面的新計(jì)劃,將人工智能的最新成果應(yīng)用至自己的部門。
在會(huì)議上,希魯梅拉帶來了一份6頁紙的計(jì)劃書。很久以前,貝索斯就提出要求,即匯報(bào)給他的產(chǎn)品和服務(wù)計(jì)劃必須限制在這一長度范圍內(nèi),同時(shí)還要配上一份模擬的新聞稿,用于描述最終成果?,F(xiàn)在,貝索斯正在依靠自己的助手們,將公司轉(zhuǎn)型成人工智能發(fā)電站。在亞馬遜的發(fā)展早期,商品推薦功能就已集成人工智能技術(shù),發(fā)貨調(diào)度和倉庫機(jī)器人也是如此。然而近年來,這個(gè)領(lǐng)域正在掀起一場(chǎng)革命:機(jī)器學(xué)習(xí)正變得越來越高效,尤其是在所謂“深度學(xué)習(xí)”技術(shù)的推動(dòng)下。計(jì)算機(jī)視覺、語音識(shí)別,以及自然語言處理等技術(shù)也都因此獲得了飛速的發(fā)展。
在這個(gè)10年的起步階段,亞馬遜并沒有大力投入這些技術(shù)。然而現(xiàn)在,亞馬遜意識(shí)到,需求非常迫切。這個(gè)時(shí)代最關(guān)鍵的競(jìng)爭(zhēng)將發(fā)生在人工智能領(lǐng)域:谷歌、Facebook、蘋果和微軟都在押注此類技術(shù),而亞馬遜已經(jīng)落后。亞馬遜設(shè)備和服務(wù)副總裁大衛(wèi)·利普(David Limp)表示:“我們找到每個(gè)團(tuán)隊(duì)負(fù)責(zé)人,問他們,‘你要如何利用這些技術(shù),將這些技術(shù)嵌入自己的業(yè)務(wù)?’”
希魯梅拉牢牢記住了這點(diǎn),并在年度計(jì)劃會(huì)議上找到貝索斯,向他提出了關(guān)于如何更積極地發(fā)展機(jī)器學(xué)習(xí)技術(shù)的設(shè)想。他認(rèn)為,亞馬遜的核心業(yè)務(wù)已發(fā)展20多年,而機(jī)器學(xué)習(xí)技術(shù)的最佳應(yīng)用場(chǎng)景是與亞馬遜核心業(yè)務(wù)不相關(guān)的圖像識(shí)別和語音識(shí)別,因此利用機(jī)器學(xué)習(xí)技術(shù)完全重新開發(fā)現(xiàn)有系統(tǒng)風(fēng)險(xiǎn)太大。他表示:“從來沒有人真正將深度學(xué)習(xí)應(yīng)用于商品推薦,并帶來更好的結(jié)果。因此,我們自己需要有信心。”然而,貝索斯想要更多,而希魯梅拉實(shí)際上并沒有做好萬全的準(zhǔn)備。因此,他分享了一個(gè)更激進(jìn)的選擇,即利用深度學(xué)習(xí)技術(shù)去顛覆商品推薦的運(yùn)轉(zhuǎn)方式。這需要用到他團(tuán)隊(duì)尚不具備的能力,尚未開發(fā)出的工具,以及從沒有人想過的算法。貝索斯很喜歡這個(gè)選擇,所以希魯梅拉重寫了一份模擬新聞稿,并著手去做。
過去幾年,大批亞馬遜管理者都曾攜帶6頁紙的計(jì)劃書去找貝索斯,希魯梅拉只是其中之一。他們提出的想法涉及到各式各樣的產(chǎn)品和完全不同的客戶。然而,他們每個(gè)人設(shè)想的都是希魯梅拉計(jì)劃的一個(gè)變種:用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)來改造亞馬遜的某個(gè)部分。其中部分涉及到對(duì)當(dāng)前項(xiàng)目的重新思考,例如機(jī)器人方面的工作及龐大的數(shù)據(jù)中心業(yè)務(wù)AWS。另一部分則是開發(fā)全新的業(yè)務(wù),例如基于語音的家電,這隨后發(fā)展成為Echo智能音箱。
最終結(jié)果的影響遠(yuǎn)遠(yuǎn)超出單個(gè)項(xiàng)目。希魯梅拉表示,在他面見貝索斯時(shí),亞馬遜的人工智能人才還是相互孤立的。“我們會(huì)交流,但不會(huì)分享很多東西,因?yàn)槲覀儽舜说慕?jīng)驗(yàn)不太容易直接轉(zhuǎn)移。”他認(rèn)為。在龐大的工程海洋里,這些是人工智能孤島。在用機(jī)器學(xué)習(xí)去改革公司之后,這樣的局面得到了改變。
盡管所有這些6頁紙計(jì)劃書都屬于亞馬遜的“單線程”團(tuán)隊(duì),即某個(gè)特定團(tuán)隊(duì)是技術(shù)的“擁有者”,但亞馬遜的團(tuán)隊(duì)之間已展開跨項(xiàng)目的合作。內(nèi)部科學(xué)家嘗試解決難題,并與其他團(tuán)隊(duì)分享各自的解決方案。在整個(gè)公司里,人工智能孤島開始相互連接起來。隨著亞馬遜人工智能項(xiàng)目目標(biāo)的擴(kuò)大,挑戰(zhàn)的復(fù)雜性也成為了吸引頂尖人才的磁石,尤其是對(duì)那些希望自己的工作立即發(fā)揮影響力的人才來說。這改變了以往亞馬遜對(duì)純學(xué)術(shù)研究的厭惡:亞馬遜的公司文化要求所有創(chuàng)新必須以服務(wù)客戶為中心。
亞馬遜喜歡使用“飛輪”一詞來描述,業(yè)務(wù)的不同部分如何運(yùn)轉(zhuǎn),并形成統(tǒng)一的永動(dòng)機(jī)?,F(xiàn)在,亞馬遜擁有強(qiáng)大的人工智能飛輪,來自某個(gè)團(tuán)隊(duì)的機(jī)器學(xué)習(xí)創(chuàng)新成為了賦能其他團(tuán)隊(duì)的利器,反過來這些團(tuán)隊(duì)開發(fā)產(chǎn)品、提供服務(wù),從而影響其他團(tuán)隊(duì),甚至整個(gè)公司。以付費(fèi)服務(wù)的形式將機(jī)器學(xué)習(xí)平臺(tái)提供給外界本身就是種能盈利的業(yè)務(wù)。在某些情況下,這還有助于收集更多數(shù)據(jù),進(jìn)一步提高技術(shù)水平。
在亞馬遜從深度學(xué)習(xí)門外漢發(fā)展成為行業(yè)重要力量的過程中,有許多這樣的6頁紙計(jì)劃書出現(xiàn)。轉(zhuǎn)型的成果在亞馬遜公司內(nèi)隨處可見,例如基于機(jī)器學(xué)習(xí)基礎(chǔ)架構(gòu)的推薦系統(tǒng)。目前亞馬遜正變得更聰明,能建議用戶下面應(yīng)該閱讀什么,應(yīng)該在購物清單上添加什么,以及今晚可以看什么電影。今年,希魯梅拉開展了一項(xiàng)新工作,即負(fù)責(zé)亞馬遜的搜索服務(wù)。他希望將深度學(xué)習(xí)技術(shù)應(yīng)用于搜索服務(wù)的方方面面。
華盛頓大學(xué)頂尖的計(jì)算機(jī)科學(xué)教授佩德羅·多明格斯(Pedro Domingos)直言:“如果在七八年前問我,亞馬遜在人工智能領(lǐng)域的影響力有多大,我可能會(huì)說,‘他們什么也不是’。但他們非常努力?,F(xiàn)在,他們已成為了這個(gè)領(lǐng)域的一股力量。”
或許,亞馬遜已經(jīng)是一股重要力量。
Alexa效應(yīng)
亞馬遜進(jìn)軍人工智能的旗艦產(chǎn)品是智能音箱Echo,以及基礎(chǔ)性的Alexa語音平臺(tái)。這些項(xiàng)目也來自于6頁紙計(jì)劃書。這樣的計(jì)劃于2011年通過名為“1號(hào)運(yùn)營計(jì)劃”的年度規(guī)劃流程提交給貝索斯。其中的參與者之一是自2004年就開始就供職于亞馬遜的阿爾·林賽(Al Lindsay)。當(dāng)時(shí),他被要求轉(zhuǎn)而負(fù)責(zé)Prime技術(shù)團(tuán)隊(duì),從事全新的項(xiàng)目。他還記得當(dāng)時(shí)提出的概念:“一種低成本、無所不在的電腦,大腦位于云端,你可以用語音與之互動(dòng)。你對(duì)它說話,它也對(duì)你說話。”
然而當(dāng)時(shí),開發(fā)這樣的系統(tǒng)聽起來就像科幻小說,產(chǎn)品似乎就像《星際迷航》中的對(duì)話計(jì)算機(jī)。這需要強(qiáng)大的人工智能能力,而當(dāng)時(shí)亞馬遜還沒有掌握這樣的技術(shù)。更糟糕的是,有能力開發(fā)此類系統(tǒng)的專家人才很稀缺,愿意在亞馬遜工作的就更加鳳毛麟角。谷歌和Facebook正在爭(zhēng)奪這個(gè)領(lǐng)域的頂尖人才。林賽表示:“我們是弱者。”他現(xiàn)在已晉升為副總裁。
華盛頓大學(xué)教授多明格斯表示:“亞馬遜的形象有點(diǎn)不太好。在外界看來,該公司對(duì)以研究為導(dǎo)向的人才不夠友好。”亞馬遜完全專注于客戶,而企業(yè)文化也崇尚好斗精神,這與學(xué)術(shù)界和競(jìng)爭(zhēng)對(duì)手的風(fēng)格完全不同。多明格斯表示:“谷歌會(huì)對(duì)你很寬容。而在亞馬遜,你需要自己從元件開始組裝電腦。”此外,亞馬遜還有更不好的形象:該公司的創(chuàng)新工作往往被視為企業(yè)機(jī)密。
2014年,頂尖的機(jī)器學(xué)習(xí)專家延恩·勒昆(Yann LeCun)在內(nèi)部會(huì)議上為亞馬遜的科學(xué)家們做了一次講座。在他被邀請(qǐng)參加此次活動(dòng)以及活動(dòng)舉行之間,勒昆接受了Facebook的職位邀請(qǐng),但他還是來到了亞馬遜的活動(dòng)現(xiàn)場(chǎng)。勒昆回憶,在一個(gè)大約可容納600人的禮堂里,他發(fā)表了演講。隨后他被領(lǐng)進(jìn)一間會(huì)議室,不同的小組一個(gè)接一個(gè)進(jìn)來,向他提問。然而當(dāng)勒昆向他們提問時(shí),這些人的反應(yīng)都很遲鈍。這讓他感覺不好。他最終選擇Facebook的職位部分也是因?yàn)椋現(xiàn)acebook同意將人工智能團(tuán)隊(duì)的很大一部分工作開源。
由于缺乏內(nèi)部人才,亞馬遜動(dòng)用強(qiáng)大的財(cái)力去收購具有這方面專業(yè)性的公司。利普表示:“在Alexa的發(fā)展早期,我們收購了許多公司。”2011年9月,亞馬遜收購了語音轉(zhuǎn)文本技術(shù)公司Yap。該公司擅長于將語音轉(zhuǎn)換為文字。2012年,亞馬遜又將來自英國劍橋的Evi收入麾下。該公司的軟件可以像Siri一樣對(duì)語音命令做出響應(yīng)。2013年1月,亞馬遜再次收購一家語音轉(zhuǎn)文本技術(shù)公司,即來自波蘭的Ivona。該公司的技術(shù)可以讓Echo獲得交談能力。
然而,亞馬遜的保密文化仍然不利于頂尖人才的加盟。埃里克斯·斯莫拉(Alex Smola)曾是亞馬遜的招聘候選人之一。他是行業(yè)明星,曾供職于雅虎和谷歌。AWS深度學(xué)習(xí)和人工智能總經(jīng)理馬特·伍德(Matt Wood)表示:“他實(shí)際上是深度學(xué)習(xí)的教父之一。”(谷歌學(xué)術(shù)搜索上列出了9萬多篇引用斯莫拉成果的論文。)亞馬遜高管甚至不愿向候選人透露他們未來的工作內(nèi)容。斯莫拉拒絕了亞馬遜的邀請(qǐng),選擇去帶領(lǐng)卡耐基梅隆大學(xué)的一所實(shí)驗(yàn)室。
林賽說:“甚至是在我們即將啟動(dòng)之前,還是有許多阻力。他們會(huì)說,‘為什么我要去亞馬遜工作?我對(duì)賣別人東西不感興趣。’”
亞馬遜也有自己的辦法。由于該公司從想象中的最終產(chǎn)品去反推,所以藍(lán)圖中包括許多尚未發(fā)明出來的功能。這些棘手的問題對(duì)雄心勃勃的科學(xué)家極具吸引力。語音功能需要一定水平的會(huì)話式人工智能,包括“喚醒詞”(嘿,Alexa!)、監(jiān)聽和解釋命令,給出合理的答案。這一切都不存在。
即使亞馬遜沒有給出任何細(xì)節(jié),這個(gè)項(xiàng)目也吸引了羅希特·普拉薩德(Rohit Prasad)。普拉薩德是一名受到廣泛認(rèn)可的語音識(shí)別科學(xué)家,來自波士頓的技術(shù)承包商雷神BBN。(亞馬遜也因此讓他在自己老家組建一支團(tuán)隊(duì)。)他認(rèn)為,亞馬遜相關(guān)專業(yè)能力的缺乏是系統(tǒng)性問題,而不僅僅是小缺陷。他指出:“這里是一片空白。谷歌和微軟開發(fā)語音技術(shù)已經(jīng)有幾年時(shí)間。在亞馬遜,我們從頭開始去開發(fā),去解決困難的問題。”在2013年加入之后,他就被分配至Alexa項(xiàng)目。他表示:“設(shè)備用硬件來實(shí)現(xiàn),但語音技術(shù)在很早就已經(jīng)起步。”
Echo項(xiàng)目中最棘手的部分在于遠(yuǎn)距離語音識(shí)別。為了解決這個(gè)問題,亞馬遜被迫涉足新領(lǐng)域,并推動(dòng)了機(jī)器學(xué)習(xí)整體的發(fā)展。遠(yuǎn)距離語音識(shí)別是指在一定距離遠(yuǎn)處識(shí)別語音,這樣的語音命令可能被淹沒在環(huán)境噪聲中。挑戰(zhàn)之一是,設(shè)備不能浪費(fèi)一丁點(diǎn)時(shí)間去思考你究竟說的是什么。它必須把音頻內(nèi)容即時(shí)發(fā)送至云端,并迅速獲得答案,給用戶的感覺就是實(shí)時(shí)對(duì)話,而不會(huì)出現(xiàn)令人尷尬的冷場(chǎng)。開發(fā)機(jī)器學(xué)習(xí)系統(tǒng),在嘈雜環(huán)境中理解并響應(yīng)用戶的語音命令,這需要大量數(shù)據(jù),即用戶與Echo互動(dòng)的大量此類案例。當(dāng)時(shí)并不清楚,亞馬遜要從何處獲得這樣的數(shù)據(jù)。
作為亞馬遜設(shè)備和服務(wù)副總裁的利普表示,遠(yuǎn)距離技術(shù)此前已經(jīng)被實(shí)現(xiàn),但當(dāng)時(shí)是用在三叉戟潛艇的鼻錐上,研發(fā)耗資達(dá)到10億美元。亞馬遜希望將這種技術(shù)集成至一個(gè)可以放在廚房臺(tái)面上的設(shè)備中,而價(jià)格必須足夠便宜,從而吸引用戶的購買。普拉薩德表示:“在我的團(tuán)隊(duì)中,90%的人都認(rèn)為這根本做不到。在亞馬遜以外,我們也有技術(shù)咨詢委員會(huì)。我們沒有告訴他們具體要做什么。但他們總是對(duì)我們提起,‘不管做什么,都不要碰遠(yuǎn)距離識(shí)別技術(shù)。’”
然而,普拉薩德的經(jīng)歷給他帶來了信心。他認(rèn)為這是可實(shí)現(xiàn)的。然而,亞馬遜并不具備工業(yè)級(jí)系統(tǒng),將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于產(chǎn)品開發(fā)。“我們有少數(shù)科學(xué)家正在研究深度學(xué)習(xí),但我們?nèi)狈A(chǔ)設(shè)施將這些技術(shù)應(yīng)用于生產(chǎn)。”他說。好消息在于,亞馬遜已經(jīng)掌握了全部模塊:無與倫比的云計(jì)算服務(wù),可運(yùn)行機(jī)器學(xué)習(xí)算法、安裝了大量GPU的數(shù)據(jù)中心,以及熟悉如何移動(dòng)數(shù)據(jù)的工程師。
他的團(tuán)隊(duì)利用這些模塊開發(fā)了平臺(tái),而除了用于Echo項(xiàng)目之外,這個(gè)平臺(tái)本身就是寶貴的資產(chǎn)。Alexa高級(jí)科學(xué)家斯派羅斯·馬特索卡斯(Spyros Matsoukas)表示:“當(dāng)我們?cè)贓cho上實(shí)現(xiàn)遠(yuǎn)距離語音識(shí)別之后,就發(fā)現(xiàn)這里的機(jī)會(huì)原來有這么大,我們可以將Alexa發(fā)展成為語音服務(wù)。”他此前曾在雷神BBN與普拉薩德共事,當(dāng)時(shí)的工作包括從事美國國防部高級(jí)研究計(jì)劃局(DARPA)的項(xiàng)目Hub4,利用廣播新聞節(jié)目和竊聽的電話通話來發(fā)展語音識(shí)別和自然語言理解技術(shù),這對(duì)Alexa項(xiàng)目來說也很有用。推動(dòng)Alexa發(fā)展的最直接方式是向第三方開放,讓開發(fā)者開發(fā)基于語音技術(shù)的迷你應(yīng)用,即“技能”,并在Echo平臺(tái)上運(yùn)行。然而,這才只是開始。
在Alexa突破Echo音箱的限制之后,亞馬遜的人工智能文化開始形成合力。公司內(nèi)的不同團(tuán)隊(duì)都開始意識(shí)到,Alexa可以為他們各自項(xiàng)目提供有用的語音服務(wù)。普拉薩德表示:“盡管我們的單線程所有權(quán)模式已經(jīng)很成熟,但仍然可以將所有數(shù)據(jù)和技術(shù)融合在一起。”
最開始,亞馬遜的其他產(chǎn)品開始集成Alexa:通過對(duì)Alexa設(shè)備的語音命令,你可以訪問亞馬遜音樂、Prime視頻、獲得亞馬遜主站的商品推薦信息,以及使用其他服務(wù)。隨后,這項(xiàng)技術(shù)開始推廣至亞馬遜的其他業(yè)務(wù)。林賽表示:“一旦我們掌握了最基本的語音能力,就可以將其集成至非Alexa產(chǎn)品,例如Fire TV、語音購物、亞馬遜生鮮的Dash按鈕,以及AWS。”
在這個(gè)過程中,亞馬遜內(nèi)部的人工智能孤島開始逐漸靠近。
亞馬遜轉(zhuǎn)型的另一大關(guān)鍵在于,一旦數(shù)百萬客戶(亞馬遜拒絕透露具體數(shù)字)開始使用Echo和其他Alexa設(shè)備,亞馬遜就能掌握豐富的數(shù)據(jù)。這或許是任何會(huì)話式設(shè)備所能積累的規(guī)模最龐大的數(shù)據(jù)集。對(duì)人才招聘來說,這樣的數(shù)據(jù)集也是極具吸引力的資源。突然之間,亞馬遜就成了那些機(jī)器學(xué)習(xí)專家夢(mèng)寐以求的雇主。去年加入亞馬遜的Alexa機(jī)器學(xué)習(xí)副總裁拉威·簡(jiǎn)恩(Ravi Jain)表示:“Alexa對(duì)我的最大吸引力之一在于,一旦你在市場(chǎng)上推出了一款設(shè)備,那么就掌握了獲得信息反饋的來源。不僅僅是用戶反饋,這些實(shí)際數(shù)據(jù)是優(yōu)化所有一切,尤其是底層平臺(tái)的基礎(chǔ)。”
因此,隨著越來越多用戶使用Alexa,亞馬遜獲得的信息不僅能讓系統(tǒng)性能變得更好,也有利于自主機(jī)器學(xué)習(xí)工具和平臺(tái)的加速發(fā)展,并成為該公司吸引機(jī)器學(xué)習(xí)科學(xué)家的重要武器。
“飛輪”終于開始旋轉(zhuǎn)起來。
更聰明的云計(jì)算
亞馬遜從2014年開始面向Prime會(huì)員銷售Echo。這一年,斯瓦米·西瓦蘇布拉曼尼(Swami Sivasubramanian)也開始對(duì)機(jī)器學(xué)習(xí)發(fā)生興趣。當(dāng)時(shí),負(fù)責(zé)AWS數(shù)據(jù)庫和數(shù)據(jù)分析業(yè)務(wù)的西瓦蘇布拉曼尼正和全家人回印度旅行。由于時(shí)差的關(guān)系和小女兒的吵鬧,他不得不在半夜去工作。他嘗試了谷歌的TensorFlow,以及Facebook和學(xué)術(shù)界支持的機(jī)器學(xué)習(xí)框架Caffe,發(fā)現(xiàn)將這些工具與亞馬遜的云計(jì)算服務(wù)結(jié)合在一起可以創(chuàng)造巨大的價(jià)值。他認(rèn)為,通過在云端運(yùn)行機(jī)器學(xué)習(xí)算法,公司可以挖掘新的需求。他表示:“我們希望每月為數(shù)百萬開發(fā)者提供服務(wù)。他們中的大部分人并不是麻省理工學(xué)院的教授,只是毫無機(jī)器學(xué)習(xí)專業(yè)背景的開發(fā)者。”
在下一次面見貝索斯時(shí),他帶著一份6頁紙的計(jì)劃書。從某種意義上來說,這是將機(jī)器學(xué)習(xí)服務(wù)添加至AWS的藍(lán)圖。不過西瓦蘇布拉曼尼認(rèn)為,實(shí)際意義還要更加廣泛:這份計(jì)劃說明了AWS如何成為機(jī)器學(xué)習(xí)研究核心的宏大愿景。
確實(shí),向成千上萬亞馬遜云計(jì)算客戶提供機(jī)器學(xué)習(xí)服務(wù)是不可避免的。AWS機(jī)器學(xué)習(xí)經(jīng)理伍德表示:“在首次提出AWS的商業(yè)計(jì)劃時(shí),我們就確定了自己的使命,即充分利用只有財(cái)力雄厚的公司才能掌握的技術(shù),并盡可能地去推廣。我們?cè)谟?jì)算、存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)庫等方面已經(jīng)取得成功,我們要用同樣的方法去對(duì)待機(jī)器學(xué)習(xí)。”在這個(gè)過程中,AWS團(tuán)隊(duì)可以利用亞馬遜其他團(tuán)隊(duì)積累的經(jīng)驗(yàn),這使得工作變得略微容易。
伍德表示,AWS的亞馬遜機(jī)器學(xué)習(xí)服務(wù)最初于2015年推出,讓類似C-Span的客戶可以建立私有的頭像目錄。此外,Zillow使用該服務(wù)估計(jì)房?jī)r(jià),而Pinterest則將其用于可視化搜索。多家自動(dòng)駕駛創(chuàng)業(yè)公司也在利用AWS機(jī)器學(xué)習(xí),通過數(shù)百萬公里的上路測(cè)試來優(yōu)化產(chǎn)品。
2016年,AWS又發(fā)布了新的機(jī)器學(xué)習(xí)服務(wù),更直接地利用Alexa的創(chuàng)新。這其中包括文本轉(zhuǎn)語音組件Polly,以及自然語言處理引擎Lex。這些產(chǎn)品幫助AWS的客戶,包括Pinterest、Netflix和多家小型創(chuàng)業(yè)公司開發(fā)屬于自己的迷你Alexa。一款涉及可視化技術(shù)的第三方服務(wù)Rekognition就利用了此前Prime Photos取得的成果,嘗試在谷歌、Facebook和蘋果的照片產(chǎn)品中植入同樣的深度學(xué)習(xí)功能。Prime Photos是亞馬遜內(nèi)部一個(gè)不太知名的團(tuán)隊(duì)。
這些機(jī)器學(xué)習(xí)服務(wù)既是強(qiáng)大的營收來源,也是亞馬遜人工智能“飛輪”的關(guān)鍵。各類機(jī)構(gòu)和公司,包括美國宇航局(NASA)和美國職業(yè)橄欖球大聯(lián)盟(NFL),都開始付費(fèi)使用亞馬遜的機(jī)器學(xué)習(xí)服務(wù)。如果企業(yè)在AWS平臺(tái)內(nèi)開發(fā)關(guān)鍵的機(jī)器學(xué)習(xí)工具,那么轉(zhuǎn)移至云計(jì)算競(jìng)爭(zhēng)對(duì)手平臺(tái)的可能性就會(huì)大幅下降。(對(duì)不起,谷歌、微軟和IBM。)
以一家規(guī)模數(shù)十億美元的公司Infor為例。該公司為企業(yè)客戶開發(fā)應(yīng)用。近期,該公司發(fā)布了一款全新的應(yīng)用Coleman(以NASA數(shù)學(xué)家的名字來命名),通過會(huì)話式界面幫助客戶實(shí)現(xiàn)各種流程的自動(dòng)化,分析性能并與數(shù)據(jù)交互。該公司沒有從頭開發(fā)自主的會(huì)話機(jī)器人,而是使用了AWS的Lex技術(shù)。Infor副總裁馬西莫·卡珀西亞(Massimo Capoccia)表示:“亞馬遜已經(jīng)在做這些事,所以我們?yōu)槭裁催€要在這上面花時(shí)間?我們了解客戶,應(yīng)該做的是將這些技術(shù)應(yīng)用于客戶。”
AWS在這個(gè)領(lǐng)域的主導(dǎo)地位也使其獲得了相對(duì)于競(jìng)爭(zhēng)對(duì)手,尤其是谷歌的優(yōu)勢(shì)。谷歌此前曾希望利用機(jī)器學(xué)習(xí)技術(shù)的領(lǐng)先優(yōu)勢(shì),在云計(jì)算市場(chǎng)趕超AWS。是的,谷歌服務(wù)器或許向客戶提供了超快速、針對(duì)機(jī)器學(xué)習(xí)優(yōu)化的芯片。但使用AWS的企業(yè)能更方便地與其他也使用AWS的企業(yè)互動(dòng)。DigitalGlobe首席技術(shù)官沃爾特·斯科特(Walter Scott)就解釋了,他的公司為什么臺(tái)使用亞馬遜的技術(shù)。“這就像是威利·薩頓(Willie Sutton)所說的,搶銀行是因?yàn)殂y行里有錢。我們使用AWS的機(jī)器學(xué)習(xí)技術(shù)是因?yàn)槲覀兊目蛻粢苍谶@個(gè)平臺(tái)上。”
去年11月,在AWS的re:Invent大會(huì)上,亞馬遜發(fā)布了更全面的機(jī)器學(xué)習(xí)工具SageMaker。這是個(gè)非常強(qiáng)大,但也很易用的平臺(tái)。SageMaker的開發(fā)者之一正是機(jī)器學(xué)習(xí)領(lǐng)域的超級(jí)明星埃里克斯·斯莫拉,5年前他曾拒絕亞馬遜的邀請(qǐng)。當(dāng)斯莫拉決定重回產(chǎn)業(yè)界時(shí),他希望協(xié)助開發(fā)強(qiáng)大的工具,讓所有普通軟件開發(fā)者都可以用上機(jī)器學(xué)習(xí)技術(shù)。所以,他加入了他認(rèn)為能帶來最大影響力的公司。他表示:“亞馬遜非常強(qiáng),你不會(huì)放棄這樣的機(jī)會(huì)。你可以寫論文,但如果不實(shí)際開發(fā),那么沒有人會(huì)使用你漂亮的算法。”
斯莫拉曾對(duì)西瓦蘇布拉曼尼說,開發(fā)工具,將機(jī)器學(xué)習(xí)技術(shù)傳播給數(shù)百萬人比新發(fā)表一篇論文更重要。當(dāng)時(shí),他得到了意外之喜。后者表示:“這也不會(huì)耽誤你發(fā)表論文!”是的,在允許科學(xué)家發(fā)表論文方面,亞馬遜正變得更開放。協(xié)助制定這方面指導(dǎo)原則的斯派羅斯·馬特索卡斯表示:“這給招聘頂尖人才帶來了巨大的幫助,同時(shí)也讓外界更好地了解,亞馬遜內(nèi)部正在開展什么樣的研究。”
目前還無法判斷,AWS的數(shù)百萬用戶是否會(huì)用SageMaker,將機(jī)器學(xué)習(xí)集成至產(chǎn)品。然而這樣做的開發(fā)者往往都會(huì)投入大筆資金,將亞馬遜定位為機(jī)器學(xué)習(xí)服務(wù)提供商。此外,這個(gè)平臺(tái)非常強(qiáng)大,就連亞馬遜內(nèi)部的人工智能團(tuán)隊(duì),例如Alexa團(tuán)隊(duì),也表示愿意成為SageMaker的客戶,使用這些原計(jì)劃提供給外部的工具。他們相信,這可以成為項(xiàng)目的基礎(chǔ),節(jié)約他們的時(shí)間,而他們自己可以將更多精力用于高級(jí)算法的研究。
盡管只有部分AWS客戶使用SageMaker,但亞馬遜發(fā)現(xiàn),該公司已經(jīng)掌握了關(guān)于系統(tǒng)性能的大量數(shù)據(jù)(當(dāng)然,不包括客戶自己保管的機(jī)密數(shù)據(jù))。這將帶來更好的算法、更棒的平臺(tái)、更多的客戶。“飛輪”正在加班加點(diǎn)地運(yùn)轉(zhuǎn)。
無所不在的人工智能
隨著機(jī)器學(xué)習(xí)帶來顛覆,亞馬遜在人工智能領(lǐng)域的專業(yè)性已經(jīng)滲透至許多團(tuán)隊(duì),這令貝索斯和他的助手們感到高興。雖然亞馬遜并沒有中心化的人工智能辦公室,但有一個(gè)部門專門負(fù)責(zé)機(jī)器學(xué)習(xí)的推廣和技術(shù)支持,而另一些部門則嘗試應(yīng)用研究成果,推動(dòng)新科技進(jìn)入亞馬遜的項(xiàng)目。曾供職于微軟必應(yīng)團(tuán)隊(duì)和Facebook的拉爾夫·赫布里奇(Ralf Herbrich)與2012年加入亞馬遜,目前負(fù)責(zé)“核心機(jī)器學(xué)習(xí)集團(tuán)”。他表示:“重要的是在公司內(nèi)部擁有這樣的社區(qū)。”(同樣的,他所在團(tuán)隊(duì)的使命也在6頁紙計(jì)劃書中列出,并獲得了貝索斯的批準(zhǔn)。)
他的部分職責(zé)是培育亞馬遜快速發(fā)展的機(jī)器學(xué)習(xí)文化。由于亞馬遜采取以客戶為中心的策略,即總是嘗試解決問題而不是單純地做研究,因此亞馬遜高管們承認(rèn),他們?cè)谡衅钢锌偸莾A向于那些有興趣開發(fā)產(chǎn)品,而不是追求科技突破的人才。Facebook的勒昆則換了句話去總結(jié)亞馬遜的態(tài)度:“不嘗試成為科技先驅(qū),也可以做得很好。”
不過,在培訓(xùn)員工接受人工智能方面,亞馬遜也在效仿Facebook和谷歌。亞馬遜開設(shè)了關(guān)于機(jī)器學(xué)習(xí)策略的內(nèi)部課程,并組織內(nèi)部專家開展研討會(huì)。從2013年開始,亞馬遜每年春季都會(huì)在總部舉辦一場(chǎng)內(nèi)部的機(jī)器學(xué)習(xí)大會(huì),這也可以被認(rèn)為是只有亞馬遜參加的NIPS大會(huì)。赫布里奇表示:“在剛剛開始時(shí),亞馬遜的機(jī)器學(xué)習(xí)大會(huì)只有幾百人參加,而現(xiàn)在已經(jīng)有數(shù)千人。我們?cè)谖餮艌D最大的辦公室也沒有這么大的容納能力,因此除了主會(huì)場(chǎng)之外,我們還向園區(qū)中的其他6個(gè)會(huì)議室直播。”亞馬遜的一名高管表示,如果規(guī)模變得更大,那么就不應(yīng)該叫亞馬遜機(jī)器學(xué)習(xí)活動(dòng),而直接叫亞馬遜的活動(dòng)。
赫布里奇的團(tuán)隊(duì)繼續(xù)推動(dòng)機(jī)器學(xué)習(xí)技術(shù)滲透至公司的各類項(xiàng)目。例如,物流部門希望更好地預(yù)測(cè),如何根據(jù)顧客的訂單在8種尺寸的包裝盒中做選擇。因此,他們找到赫布里奇的團(tuán)隊(duì)尋求幫助。赫布里奇表示:“這個(gè)部門不需要自己的科研團(tuán)隊(duì),但需要算法,并能方面地使用這些算法。”大衛(wèi)·利普則提到了另一個(gè)例子,即亞馬遜如何預(yù)測(cè)有多少顧客可能會(huì)購買一款新產(chǎn)品。“我參與消費(fèi)電子行業(yè)已有30年,在其中25年的時(shí)間里,預(yù)測(cè)是基于人工判斷,會(huì)用到表格,一些魔法球和飛鏢。當(dāng)我們開始在預(yù)測(cè)過程中運(yùn)用機(jī)器學(xué)習(xí)技術(shù)后,錯(cuò)誤率大幅下降。”
不過有些時(shí)候,赫布里奇的團(tuán)隊(duì)仍然會(huì)將尖端科技用于解決特定問題。亞馬遜生鮮快遞服務(wù)亞馬遜Fresh的經(jīng)營已有10年,但仍需要更好的方式來評(píng)估生鮮果蔬的質(zhì)量。人工檢測(cè)速度太慢,也無法保持標(biāo)準(zhǔn)的一致性。他的柏林團(tuán)隊(duì)開發(fā)了集成大量傳感器的硬件和新算法,以彌補(bǔ)系統(tǒng)無法感知食品的缺陷。“經(jīng)過3年之后,我們已經(jīng)有了原型產(chǎn)品,可以更可靠地判斷食品質(zhì)量。”
當(dāng)然,這樣的技術(shù)進(jìn)步可以滲透到整個(gè)亞馬遜生態(tài)系統(tǒng)。以近期正式開業(yè)的亞馬遜Go無人店為例。亞馬遜Go技術(shù)副總裁迪利普·庫馬爾(Dilip Kumar)表示:“作為AWS的客戶,我們從規(guī)模效應(yīng)中受益。但AWS也是受益者。”他指出,亞馬遜Go開發(fā)了獨(dú)特的系統(tǒng),能從數(shù)百個(gè)追蹤顧客購物活動(dòng)的攝像頭傳送數(shù)據(jù)。他團(tuán)隊(duì)的創(chuàng)新影響了名為Kinesis的AWS服務(wù)。該服務(wù)使客戶可以從多個(gè)設(shè)備將視頻流媒體傳送至AWS云端,而AWS將對(duì)其進(jìn)行處理、分析,優(yōu)化未來的機(jī)器學(xué)習(xí)算法。
即使一款亞馬遜服務(wù)尚未使用機(jī)器學(xué)習(xí)平臺(tái),也可以主動(dòng)參與到這一過程中。亞馬遜Prime Air無人機(jī)快遞服務(wù)仍處于原型階段,但也開發(fā)了獨(dú)立人工智能能力,因?yàn)闊o人機(jī)無法依靠云連接。然而,Prime Air也從人工智能“飛輪”中獲益良多,無論是向公司的其他部門學(xué)習(xí)經(jīng)驗(yàn),還是弄清楚應(yīng)該使用什么工具。Prime Air副總裁古爾·金姆奇(Gur Kimchi)表示:“我們將這視為餐廳的菜單,所有人都在分享他們有什么樣的美味。”他預(yù)計(jì),他的團(tuán)隊(duì)最終也將拿出自己的美味菜單。“在Prime Air,我們學(xué)到的經(jīng)驗(yàn)和解決的問題毫無疑問能吸引亞馬遜其他部門的興趣。”
實(shí)際上,這似乎已經(jīng)在發(fā)生。亞馬遜機(jī)器人首席科學(xué)家貝斯·馬庫斯(Beth Marcus)表示:“如果有人在公司的某個(gè)部門,例如Prime Air或亞馬遜Go看到一幅畫面,學(xué)到一些東西,開發(fā)一種算法,他們就會(huì)與公司內(nèi)的其他人交流。所以,我團(tuán)隊(duì)中有些人就可以借鑒,例如弄清楚商品在物流中心里究竟是怎么移動(dòng)的。”
一家以商品為中心的公司能否勝過擁有大量深度學(xué)習(xí)超級(jí)明星的競(jìng)爭(zhēng)對(duì)手?亞馬遜正在努力實(shí)現(xiàn)這個(gè)目標(biāo)。艾倫人工智能研究所CEO奧林·艾奇奧尼(Oren Etzioni)表示:“盡管他們還在追趕,但他們的產(chǎn)品發(fā)布令人印象深刻。亞馬遜是世界級(jí)的公司,開發(fā)了世界級(jí)的人工智能產(chǎn)品。”
“飛輪”一直在旋轉(zhuǎn),許多6頁紙計(jì)劃書的影響尚未體現(xiàn)出來。這或許意味著更多數(shù)據(jù),更多顧客,更優(yōu)秀的平臺(tái),更豐富的人才。
如果你去問Alexa,亞馬遜在人工智能領(lǐng)域做得怎么樣?那么答案或許是貝索斯的大笑。
評(píng)論