【深度】谷歌人工智能10年之路

作者：時(shí)間：2016-12-21 來源：科技雜談

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　盡管迦南德里不相信“機(jī)器會(huì)殺死我們”這樣的預(yù)言，但他認(rèn)為機(jī)器學(xué)習(xí)系統(tǒng)將成為革命性技術(shù)，從醫(yī)療診斷到無人駕駛汽車，各行各業(yè)都將利用這種技術(shù)。雖然機(jī)器學(xué)習(xí)不會(huì)取代人類，但它卻會(huì)改變?nèi)祟悺?/p>本文引用地址：http://m.butianyuan.cn/article/201612/341843.htm

　　迦南德里以Google Photos為例進(jìn)行了解釋。這款產(chǎn)品的標(biāo)志性功能是能夠在圖片中識(shí)別出用戶指定的物品，這令人感覺頗為神秘，甚至有些不安。通過學(xué)習(xí)，電腦可“知道”邊境牧羊犬的樣子，而且可以識(shí)別出不同年齡和毛長的邊境牧羊犬。

　　對(duì)于人類來說，這可能十分容易，但沒人能夠從數(shù)百萬張圖片中篩選出來這些照片，同時(shí)還能識(shí)別出不同的犬種，而機(jī)器學(xué)習(xí)系統(tǒng)就可以做到。如果它了解了一個(gè)犬種，便可使用相同的技術(shù)識(shí)別出另外9999個(gè)犬種。迦南德里說：“這才是真正令人感到新奇的地方。在這樣狹小的領(lǐng)域，你甚至可以看到機(jī)器學(xué)習(xí)系統(tǒng)具備超人能力。”

　　進(jìn)入熱門產(chǎn)品

　　谷歌早已了解機(jī)器學(xué)習(xí)的概念，該公司的創(chuàng)始人就是強(qiáng)大人工智能的堅(jiān)定信奉者。機(jī)器學(xué)習(xí)已經(jīng)被應(yīng)用到谷歌很多產(chǎn)品中，盡管并非總是采用最近熱門的神經(jīng)網(wǎng)絡(luò)技術(shù)。

　　事實(shí)上，谷歌10年前就開始通過內(nèi)部培訓(xùn)，向公司工程師傳授機(jī)器學(xué)習(xí)技術(shù)。2005年初，當(dāng)時(shí)負(fù)責(zé)谷歌搜索業(yè)務(wù)的彼得·諾維格(Peter Norvig)向研究科學(xué)家大衛(wèi)·帕布洛·科恩(David Pablo Cohn)提議，希望知道谷歌能否采用卡內(nèi)基-梅隆大學(xué)組織的相關(guān)課程。

　　而科恩表示，只有谷歌自己才能教授這種內(nèi)部課程，因?yàn)楣雀璧倪\(yùn)營規(guī)模與其他公司都大不相同。所以他改造了谷歌總部43號(hào)樓一個(gè)大房間，每周三在那里開設(shè)兩小時(shí)的課程。就連迪恩也參加過幾次。

　　科恩說：“那是全世界最好的課程。作為工程師，他們都比我優(yōu)秀得多!”這門課程非常受歡迎，幾乎座無虛席。就連班加羅爾辦事處的員工都會(huì)特意等到午夜之后，以便接入遠(yuǎn)程教學(xué)系統(tǒng)。

　　幾年后，部分谷歌員工把授課內(nèi)容制作成了短片，從而結(jié)束了直播授課的歷史。但科恩認(rèn)為，這門課程算得上是MOOC(大規(guī)模開放在線課程)的先驅(qū)。在隨后幾年，谷歌還針對(duì)機(jī)器學(xué)習(xí)培訓(xùn)展開了其他嘗試，但這些嘗試缺乏條理性和連續(xù)性?？贫?013年離開谷歌后，機(jī)器學(xué)習(xí)突然間成為谷歌關(guān)注的重點(diǎn)領(lǐng)域。

　　但在2012年以前，機(jī)器學(xué)習(xí)課程的重要性還未獲得充分認(rèn)識(shí)，直到迦南德里決定“吸收大量從事這項(xiàng)工作的人”，并將他們安排到同樣的辦公樓之后。始于Google X部門的“谷歌大腦”也加入進(jìn)來。

　　迦南德里說：“我們吸收了很多團(tuán)隊(duì)，將他們安排到同一棟辦公樓內(nèi)，還提供了全新的咖啡機(jī)。有些人之前只接觸過所謂的感知計(jì)算，即聲音和語音識(shí)別等技術(shù)，而現(xiàn)在他們可以與那些從事語言研究的人共同探討。”

　　越來越多地，這些工程師們開發(fā)的機(jī)器學(xué)習(xí)技術(shù)開始出現(xiàn)在谷歌的熱門產(chǎn)品中。由于視覺、語音識(shí)別以及翻譯是機(jī)器學(xué)習(xí)的主要領(lǐng)域，因此無需感到驚訝，這項(xiàng)技術(shù)成為谷歌語音搜索、翻譯和Photos等服務(wù)的重要組成部分。更重要的是，機(jī)器學(xué)習(xí)技術(shù)將被應(yīng)用到所有產(chǎn)品中。

　　迪恩表示，隨著他和他的團(tuán)隊(duì)對(duì)機(jī)器學(xué)習(xí)的理解逐步深入，他們開始以更具野心的方式探索這項(xiàng)技術(shù)。

　　他說：“我們之前或許會(huì)在系統(tǒng)的組件中使用機(jī)器學(xué)習(xí)技術(shù)，現(xiàn)在則會(huì)使用這項(xiàng)技術(shù)替代整套系統(tǒng)，而非為每個(gè)組件設(shè)計(jì)更好的機(jī)器學(xué)習(xí)模式。”迪恩表示，如果現(xiàn)在讓他重新編寫谷歌的基礎(chǔ)架構(gòu)，其中的很多內(nèi)容都不再是預(yù)先編好的代碼，而是后期學(xué)習(xí)而來的。

　　格雷格·考拉多，谷歌大腦項(xiàng)目聯(lián)合創(chuàng)始人，正在和多個(gè)團(tuán)隊(duì)協(xié)作，將人工智能應(yīng)用到谷歌產(chǎn)品中。

　　機(jī)器學(xué)習(xí)還能夠?qū)⒃緹o法想象的功能植入到產(chǎn)品中，比如2015年11月推出的Gmail自動(dòng)回復(fù)功能。這個(gè)功能源自“谷歌大腦”項(xiàng)目聯(lián)合創(chuàng)始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的對(duì)話。

　　考拉多之前曾經(jīng)與Gmail團(tuán)隊(duì)合作使用機(jī)器學(xué)習(xí)算法探測垃圾信息、歸類郵件，但米克洛斯提出了更激進(jìn)的建議：能否利用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)生成回復(fù)郵件，省去移動(dòng)用戶在狹小的鍵盤上輸入文字的麻煩。

　　考拉多說：“當(dāng)初我?guī)缀躞@呆了，因?yàn)檫@個(gè)建議太瘋狂了。但我后來覺得，借助我們始終都在研究的預(yù)測性神經(jīng)網(wǎng)絡(luò)技術(shù)，或許可能實(shí)現(xiàn)。而在意識(shí)到這是一個(gè)機(jī)會(huì)的時(shí)候，我們就必須去嘗試。”

　　為了提高成功概率，谷歌讓考拉多及其團(tuán)隊(duì)與Gmail部門展開了密切合作，這種派遣機(jī)器學(xué)習(xí)專家進(jìn)駐產(chǎn)品部門的做法如今已經(jīng)越來越普遍?？祭嗾f：“機(jī)器學(xué)習(xí)既是科學(xué)又是藝術(shù)，這就像烹飪。雖然烹飪過程發(fā)生了化學(xué)反應(yīng)，但對(duì)于真正對(duì)烹飪感興趣的人來說，必須要學(xué)習(xí)如何搭配手中的食材。”

　　傳統(tǒng)的人工智能技術(shù)在理解語言時(shí)，需要將語音規(guī)則嵌入系統(tǒng)。但在這個(gè)項(xiàng)目中，系統(tǒng)可以利用現(xiàn)代化的機(jī)器學(xué)習(xí)技術(shù)，借助足夠的數(shù)據(jù)自主學(xué)習(xí)，就像兒童自學(xué)那樣。

　　考拉多說：“我并不是跟著語言學(xué)家學(xué)會(huì)說話的，而是通過聽別人說話學(xué)來的。”。但真正令智能回復(fù)變得切實(shí)可行的，是它的成功很容易定義——他們的目的不是創(chuàng)造一個(gè)妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson，電影《她》中的智能操作系統(tǒng))，而是希望它能回復(fù)真正的電子郵件。

　　考拉多說：“這項(xiàng)服務(wù)的成功標(biāo)志是，用戶覺得機(jī)器生成的備選回復(fù)有用，可被當(dāng)作自己的真正回復(fù)使用。”因此，只需要知道用戶是否點(diǎn)擊了系統(tǒng)推薦的回復(fù)內(nèi)容，便可對(duì)其進(jìn)行訓(xùn)練。

　　然而，在開始測試智能回復(fù)功能時(shí)，用戶卻注意到了怪異事情：系統(tǒng)經(jīng)常會(huì)推薦一些不合時(shí)宜的浪漫回應(yīng)?？祭嗾f：“其中一種失敗模式是：只要系統(tǒng)感覺困惑，它就會(huì)說‘我愛你’。這并不是軟件漏洞，而是我們的錯(cuò)誤引導(dǎo)它如此做。”這個(gè)程序已經(jīng)了解人類行為的某些微妙之處：“比如你感到擔(dān)憂是說一句‘我愛你’，其實(shí)是一種很好的防御策略。”考拉多幫助該團(tuán)隊(duì)壓制了系統(tǒng)的熱情。

　　去年11月發(fā)布的智能回復(fù)功能取得了巨大成功，Gmail Inbox應(yīng)用的用戶現(xiàn)在可以直接從系統(tǒng)提供的三條備選內(nèi)容中選擇一條，輕輕碰觸即可進(jìn)行回復(fù)。由于系統(tǒng)提供的回復(fù)內(nèi)容非常切題，用戶經(jīng)常感到不可思議。在通過該應(yīng)用發(fā)送的回復(fù)信息中，有1/10都是由機(jī)器學(xué)習(xí)系統(tǒng)生成的?？祭嘈χf：“這個(gè)項(xiàng)目能夠成功還是令我感到有些驚訝。”

新聞中心

【深度】谷歌人工智能10年之路

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)