【深度】谷歌人工智能10年之路
盡管迦南德里不相信“機器會殺死我們”這樣的預(yù)言,但他認為機器學(xué)習系統(tǒng)將成為革命性技術(shù),從醫(yī)療診斷到無人駕駛汽車,各行各業(yè)都將利用這種技術(shù)。雖然機器學(xué)習不會取代人類,但它卻會改變?nèi)祟悺?/p>本文引用地址:http://m.butianyuan.cn/article/201612/341843.htm
迦南德里以Google Photos為例進行了解釋。這款產(chǎn)品的標志性功能是能夠在圖片中識別出用戶指定的物品,這令人感覺頗為神秘,甚至有些不安。通過學(xué)習,電腦可“知道”邊境牧羊犬的樣子,而且可以識別出不同年齡和毛長的邊境牧羊犬。
對于人類來說,這可能十分容易,但沒人能夠從數(shù)百萬張圖片中篩選出來這些照片,同時還能識別出不同的犬種,而機器學(xué)習系統(tǒng)就可以做到。如果它了解了一個犬種,便可使用相同的技術(shù)識別出另外9999個犬種。迦南德里說:“這才是真正令人感到新奇的地方。在這樣狹小的領(lǐng)域,你甚至可以看到機器學(xué)習系統(tǒng)具備超人能力。”
進入熱門產(chǎn)品
谷歌早已了解機器學(xué)習的概念,該公司的創(chuàng)始人就是強大人工智能的堅定信奉者。機器學(xué)習已經(jīng)被應(yīng)用到谷歌很多產(chǎn)品中,盡管并非總是采用最近熱門的神經(jīng)網(wǎng)絡(luò)技術(shù)。
事實上,谷歌10年前就開始通過內(nèi)部培訓(xùn),向公司工程師傳授機器學(xué)習技術(shù)。2005年初,當時負責谷歌搜索業(yè)務(wù)的彼得·諾維格(Peter Norvig)向研究科學(xué)家大衛(wèi)·帕布洛·科恩(David Pablo Cohn)提議,希望知道谷歌能否采用卡內(nèi)基-梅隆大學(xué)組織的相關(guān)課程。
而科恩表示,只有谷歌自己才能教授這種內(nèi)部課程,因為谷歌的運營規(guī)模與其他公司都大不相同。所以他改造了谷歌總部43號樓一個大房間,每周三在那里開設(shè)兩小時的課程。就連迪恩也參加過幾次。
科恩說:“那是全世界最好的課程。作為工程師,他們都比我優(yōu)秀得多!”這門課程非常受歡迎,幾乎座無虛席。就連班加羅爾辦事處的員工都會特意等到午夜之后,以便接入遠程教學(xué)系統(tǒng)。
幾年后,部分谷歌員工把授課內(nèi)容制作成了短片,從而結(jié)束了直播授課的歷史。但科恩認為,這門課程算得上是MOOC(大規(guī)模開放在線課程)的先驅(qū)。在隨后幾年,谷歌還針對機器學(xué)習培訓(xùn)展開了其他嘗試,但這些嘗試缺乏條理性和連續(xù)性??贫?013年離開谷歌后,機器學(xué)習突然間成為谷歌關(guān)注的重點領(lǐng)域。
但在2012年以前,機器學(xué)習課程的重要性還未獲得充分認識,直到迦南德里決定“吸收大量從事這項工作的人”,并將他們安排到同樣的辦公樓之后。始于Google X部門的“谷歌大腦”也加入進來。
迦南德里說:“我們吸收了很多團隊,將他們安排到同一棟辦公樓內(nèi),還提供了全新的咖啡機。有些人之前只接觸過所謂的感知計算,即聲音和語音識別等技術(shù),而現(xiàn)在他們可以與那些從事語言研究的人共同探討。”
越來越多地,這些工程師們開發(fā)的機器學(xué)習技術(shù)開始出現(xiàn)在谷歌的熱門產(chǎn)品中。由于視覺、語音識別以及翻譯是機器學(xué)習的主要領(lǐng)域,因此無需感到驚訝,這項技術(shù)成為谷歌語音搜索、翻譯和Photos等服務(wù)的重要組成部分。更重要的是,機器學(xué)習技術(shù)將被應(yīng)用到所有產(chǎn)品中。
迪恩表示,隨著他和他的團隊對機器學(xué)習的理解逐步深入,他們開始以更具野心的方式探索這項技術(shù)。
他說:“我們之前或許會在系統(tǒng)的組件中使用機器學(xué)習技術(shù),現(xiàn)在則會使用這項技術(shù)替代整套系統(tǒng),而非為每個組件設(shè)計更好的機器學(xué)習模式。”迪恩表示,如果現(xiàn)在讓他重新編寫谷歌的基礎(chǔ)架構(gòu),其中的很多內(nèi)容都不再是預(yù)先編好的代碼,而是后期學(xué)習而來的。
格雷格·考拉多,谷歌大腦項目聯(lián)合創(chuàng)始人,正在和多個團隊協(xié)作,將人工智能應(yīng)用到谷歌產(chǎn)品中。
機器學(xué)習還能夠?qū)⒃緹o法想象的功能植入到產(chǎn)品中,比如2015年11月推出的Gmail自動回復(fù)功能。這個功能源自“谷歌大腦”項目聯(lián)合創(chuàng)始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的對話。
考拉多之前曾經(jīng)與Gmail團隊合作使用機器學(xué)習算法探測垃圾信息、歸類郵件,但米克洛斯提出了更激進的建議:能否利用機器學(xué)習技術(shù)自動生成回復(fù)郵件,省去移動用戶在狹小的鍵盤上輸入文字的麻煩。
考拉多說:“當初我?guī)缀躞@呆了,因為這個建議太瘋狂了。但我后來覺得,借助我們始終都在研究的預(yù)測性神經(jīng)網(wǎng)絡(luò)技術(shù),或許可能實現(xiàn)。而在意識到這是一個機會的時候,我們就必須去嘗試。”
為了提高成功概率,谷歌讓考拉多及其團隊與Gmail部門展開了密切合作,這種派遣機器學(xué)習專家進駐產(chǎn)品部門的做法如今已經(jīng)越來越普遍??祭嗾f:“機器學(xué)習既是科學(xué)又是藝術(shù),這就像烹飪。雖然烹飪過程發(fā)生了化學(xué)反應(yīng),但對于真正對烹飪感興趣的人來說,必須要學(xué)習如何搭配手中的食材。”
傳統(tǒng)的人工智能技術(shù)在理解語言時,需要將語音規(guī)則嵌入系統(tǒng)。但在這個項目中,系統(tǒng)可以利用現(xiàn)代化的機器學(xué)習技術(shù),借助足夠的數(shù)據(jù)自主學(xué)習,就像兒童自學(xué)那樣。
考拉多說:“我并不是跟著語言學(xué)家學(xué)會說話的,而是通過聽別人說話學(xué)來的。”。但真正令智能回復(fù)變得切實可行的,是它的成功很容易定義——他們的目的不是創(chuàng)造一個妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson,電影《她》中的智能操作系統(tǒng)),而是希望它能回復(fù)真正的電子郵件。
考拉多說:“這項服務(wù)的成功標志是,用戶覺得機器生成的備選回復(fù)有用,可被當作自己的真正回復(fù)使用。”因此,只需要知道用戶是否點擊了系統(tǒng)推薦的回復(fù)內(nèi)容,便可對其進行訓(xùn)練。
然而,在開始測試智能回復(fù)功能時,用戶卻注意到了怪異事情:系統(tǒng)經(jīng)常會推薦一些不合時宜的浪漫回應(yīng)。考拉多說:“其中一種失敗模式是:只要系統(tǒng)感覺困惑,它就會說‘我愛你’。這并不是軟件漏洞,而是我們的錯誤引導(dǎo)它如此做。”這個程序已經(jīng)了解人類行為的某些微妙之處:“比如你感到擔憂是說一句‘我愛你’,其實是一種很好的防御策略。”考拉多幫助該團隊壓制了系統(tǒng)的熱情。
去年11月發(fā)布的智能回復(fù)功能取得了巨大成功,Gmail Inbox應(yīng)用的用戶現(xiàn)在可以直接從系統(tǒng)提供的三條備選內(nèi)容中選擇一條,輕輕碰觸即可進行回復(fù)。由于系統(tǒng)提供的回復(fù)內(nèi)容非常切題,用戶經(jīng)常感到不可思議。在通過該應(yīng)用發(fā)送的回復(fù)信息中,有1/10都是由機器學(xué)習系統(tǒng)生成的??祭嘈χf:“這個項目能夠成功還是令我感到有些驚訝。”
評論