人工智能領(lǐng)域最重要的10大里程碑:AlphaGo征服世人
業(yè)界媒體TechRadar發(fā)表文章,稱人工智能(AI)是目前科技界最熱門的流行語,經(jīng)過幾十年的研究和發(fā)展之后,科幻小說中的許多技術(shù)已經(jīng)在這幾年慢慢轉(zhuǎn)化為科學現(xiàn)實。這篇文章總結(jié)了AI領(lǐng)域的10大里程碑。以下為原文內(nèi)容:
本文引用地址:http://m.butianyuan.cn/article/201801/374417.htmAI技術(shù)已經(jīng)成為我們生活中非常重要的一部分:AI決定了我們的搜索結(jié)果,將我們的聲音轉(zhuǎn)化為計算機指令,甚至可以幫助我們對黃瓜進行分類(這件事后文中會提到)。在接下來的幾年里,我們將用AI駕駛汽車,回應顧客的詢問,以及處理其他無數(shù)事情。
但是我們怎么走到這個階段的?這種強大的新技術(shù)是怎么來的?下面就來看看AI技術(shù)發(fā)展的十大里程碑。
笛卡爾的理念
人工智能的概念并不是突然出現(xiàn)的 ——直到今天,人工智能仍然是哲學辯論的一個主題:機器真的能像人類一樣思考嗎?機器能成為人類嗎?最早想到這個問題的人之一是1637年的笛卡兒。在一本名為《方法論》(Discourse on the Method)的書中,笛卡兒竟然總結(jié)出了如今的科技人員必須克服的關(guān)鍵問題和挑戰(zhàn):
“如果為了各種實用性的目的,機器在外形上向人類靠攏,并模仿人類的行為,那么我們?nèi)匀粦撚袃煞N非常確定的方法來辨識出它們不是真人。”
笛卡爾表示,在他看來,機器永遠無法使用言語,或者“把標識放在一起”來“向別人表達想法”,即使我們能夠設想出這樣的機器,但是“讓一臺機器對文字進行組合,對別人的話做出有意義的,即便水平和最愚笨的人差不多的回答,那也是不可想象的。”
他還提到了我們現(xiàn)在面臨的一個挑戰(zhàn):創(chuàng)建一個廣義的AI,而不是狹義的AI——以及當前AI的局限性會如何暴露它并非人類:
“即使有些機器可以在有些事情上可以做得和我們一樣好,或者甚至更好,但是其他機器也不可避免地會失敗,這就表明它們的行為并非來自于對事物理解,只是一種簡單的回應。”
模仿游戲
AI的第二個主要的哲學基準來自計算機科學先驅(qū)圖靈(Alan Turing)。在1950年時,他提出了“圖靈測試”,他稱之為“模仿游戲”。這個測試衡量的是,我們什么時候可以宣布智能機器出現(xiàn)了。
這個測試很簡單:如果評判者不知道哪一方是人類,哪一方是機器(比如閱讀兩者之間的文本對話時),那么機器能否騙過評判者,讓他以為自己是人類?
有趣的是,圖靈對未來的計算做出了一個大膽的預測——他估計到20世紀末,機器就可以通過圖靈測試。他說:
“我相信,在大約50年的時間內(nèi),人們就有可能用上1GB的存儲容量的計算機,通過編程讓它們玩模仿游戲,玩得足夠逼真,以至于一般的評判者在經(jīng)過5分鐘的對話之后,做出正確的判定的可能性低于70%…… 我相信,到本世紀末,文字的使用和通識教育理念將會發(fā)生很大的變化,那時你談論機器思維,通常不會引發(fā)抵觸情緒。”
可惜的是,他的預測不太準確。我們現(xiàn)在確實開始看到一些真正讓人眼前一亮的AI系統(tǒng)出現(xiàn),但是在2000年代,AI技術(shù)還處在比較原始的階段。不過硬盤容量在世紀之交時平均為10GB左右,這倒是遠遠超過了圖靈的預測。
第一個神經(jīng)網(wǎng)絡的出現(xiàn)
神經(jīng)網(wǎng)絡其實是一種試錯法,它是現(xiàn)代AI的關(guān)鍵概念。從本質(zhì)上講,當你訓練一個AI系統(tǒng)時,最好的辦法就是讓系統(tǒng)猜測,接收反饋,然后在繼續(xù)猜測——不斷調(diào)整概率,以便讓AI系統(tǒng)得出正確答案。
令人驚奇的是,第一個神經(jīng)網(wǎng)絡實際上是在1951年由馬爾文·明斯基(Marvin Minsky)和迪恩·艾德蒙茲(Dean Edmonds)創(chuàng)建的,稱為“SNARC” ,意思是隨機神經(jīng)模擬增強計算機。它不是由微芯片和晶體管,而是由真空管、電機和離合器制成的。
這臺機器可以幫助一只虛擬老鼠解決迷宮難題。系統(tǒng)發(fā)送指令,讓虛擬老鼠在迷宮里游走,每一次都將其行為的效果反饋到系統(tǒng)里——用真空管來存儲結(jié)果。這意味著機器能夠?qū)W習并調(diào)整概率,提高虛擬老鼠通過迷宮的機會。
本質(zhì)上,谷歌當前用于識別照片中的對象的相同過程的非常非常簡單的版本。
谷歌目前用來識別照片中的對象也使用了同樣的過程,只不過遠比它復雜。
第一輛自動駕駛汽車的出現(xiàn)
現(xiàn)在我們提到自動駕駛汽車的時候,可能會想到谷歌Waymo等等,但是令人吃驚的是,在1995年,梅賽德斯-奔馳就改裝了一輛汽車,從慕尼黑開到哥本哈根,路上大部分時候都是自動駕駛的。
這段路程共1043英里,改裝車上搭載了60個晶體電腦芯片,那是當時并行計算領(lǐng)域最先進的技術(shù),讓它可以快速處理大量駕駛數(shù)據(jù),為自動駕駛汽車的響應度提供保證。
這輛車的時速達到了115英里,與當今的自動駕駛汽車相差無幾,因為它可以超車并讀取路標。
轉(zhuǎn)向“基于統(tǒng)計”的方法
雖然神經(jīng)網(wǎng)絡作為一個概念出現(xiàn)已經(jīng)有一段時間了,但是直到20世紀80年代后期,AI研究人員開始從“基于規(guī)則”的方法轉(zhuǎn)向“基于統(tǒng)計”的方法 ,也就是機器學習。這意味著不要試圖去根據(jù)人類行為的規(guī)則來讓系統(tǒng)進行模仿,而是采取試錯法,根據(jù)反饋來調(diào)整概率,這是教會機器思考的好方法。這一點非常重要,因為正是這個概念讓如今的AI辦到了一些令人驚訝的事情。
《福布斯》的吉爾·普利斯(Gil Press)認為,這一轉(zhuǎn)變是從1988年開始的,當時IBM的TJ Watson研究中心發(fā)表了一篇名為《語言翻譯的統(tǒng)計學方法》的論文,特別提到了如何使用機器學習來做語言翻譯。
IBM用220萬對法文和英文句子來訓練這個系統(tǒng) ——這些句子全部來自加拿大議會的雙語記錄。220萬這個數(shù)字聽起來很多,但是谷歌有整個互聯(lián)網(wǎng)上可以利用——所以現(xiàn)在谷歌翻譯的效果可以說相當不錯了。
“深藍”擊敗國際象棋冠軍
盡管AI的側(cè)重點已經(jīng)轉(zhuǎn)移到統(tǒng)計模型上,但基于規(guī)則的模型也仍然在使用—— 在1997年舉辦了一場國際象棋比賽中,IBM的計算機深藍戰(zhàn)勝了世界國際象棋冠軍加里·卡斯帕羅夫,向人們展示了機器可以有多么強大。
這不是雙方的第一場比賽,在1996年,卡斯帕羅夫曾以4-2擊敗深藍。而到了1997年,機器就占了上風。
從一定程度上說,深藍的智能有點虛假——IBM本身認為深藍沒有使用人工智能,因為它使用的是蠻力之法,每秒處理數(shù)千種走棋的可能性。 IBM為這個系統(tǒng)注入了數(shù)以千計之前比賽的數(shù)據(jù),每次對手走棋之后,深藍就會照搬以前象棋大師們在相同情況下的反應。正如IBM所說,深藍只是在扮演之前象棋大師們的幽靈。
不管這算不算真正的AI,它都是一個重要的里程碑,讓人們不僅開始關(guān)心計算機的計算能力,也對整個AI領(lǐng)域產(chǎn)生了興趣。自從與卡斯帕羅夫?qū)Q以來,在游戲中打敗人類玩家已經(jīng)成為機器智能基準測試的主要方式 —— 2011年時,我們再次看到,IBM的“沃森”系統(tǒng)輕松地擊敗了兩個人類對手,成為美國智力競賽節(jié)目《危險邊緣》的優(yōu)勝者。
Siri 和自然語言處理
自然語言處理是AI領(lǐng)域的一大課題,要想像《星際迷航》(Star Trek)那樣通過語音對設備發(fā)布命令,就需要有很強的自然語言處理能力。
所以,用統(tǒng)計方法創(chuàng)建的Siri令人眼前一亮。它由SRI International研發(fā),甚至曾經(jīng)在iOS應用程序商店中作為獨立的app推出,很快,這家公司就被蘋果公司收購,并深度整合在了iOS中?,F(xiàn)在它和谷歌助手、微軟小娜,以及亞馬遜Alexa這些軟件已經(jīng)成為機器學習最引人矚目的成果之一,改變了我們與設備互動的方式。
當然,我們?nèi)缃袼坪跽J為這種互動方式是理所當然的,但是任何曾經(jīng)在2010年之前嘗試過使用語音命令的人都知道,這個進步有多大。
圖像識別
就像在語音識別上一樣,AI也可以在圖像識別領(lǐng)域大有作為。在2015年,研究人員首次得出結(jié)論:在1000多個類別中,谷歌和微軟研發(fā)的兩個深度學習系統(tǒng)識別圖像的效果比人類更好。
圖像識別可以應用在數(shù)不清的方面,谷歌在推廣其TensorFlow機器學習平臺時舉一個有趣的例子,就是對黃瓜進行分類:通過使用計算機視覺,農(nóng)民不需要雇用人員來決定黃瓜是否合適采摘了,而是讓機器來自動做出決定,只要這些機器接受過早期數(shù)據(jù)的培訓即可。
GPU讓AI變得更便宜
AI現(xiàn)在如此引人矚目,一個重要原因就是在過去的幾年里,處理大量數(shù)據(jù)的成本已經(jīng)變得沒有那么高昂了。
據(jù)《財富》報道,研究人員直到21世紀末才意識到,為3D圖形和游戲而開發(fā)的圖形處理單元(GPU)在深度學習計算方面比傳統(tǒng)的CPU強20到50倍。在那之后,人們可以利用的計算能力就大大增加了,如今的AI云平臺可以為無數(shù)AI應用提供動力。
所以,要感激玩家。你的父母和配偶可能不會喜歡你花這么多時間來玩游戲 —— 但人工智能研究人員確實很感激你。
AlphaGo和AlphaGoZero征服世人
2016年3月,人工智能又達到了一座里程碑——谷歌的AlphaGo擊敗了圍棋九段李世石。
從數(shù)學上說,圍棋比國際象棋更加復雜,但這次勝利的重要之處在于,AlphaGo是用人類和AI對手組合進行訓練的。據(jù)報道,谷歌使用了1920個CPU和280個GPU,在和李世石的五局比賽中贏得了四局。
而更新之后的版本AlphaGo Zero更加厲害,它不像AlphaGo和深藍那樣使用任何以前的數(shù)據(jù)來學習下棋,而是直接打了數(shù)以千場的比賽,經(jīng)過三天這樣的訓練,它就能擊敗AlphaGo了。也就是說,這臺機器擁有自學能力。
評論