人類多余？AI想超越人類可沒(méi)那么容易

作者：時(shí)間：2017-10-25 來(lái)源：OFweek機(jī)器人網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編者按：AI也只不過(guò)是由人類為了某些需求而用技術(shù)加持的一個(gè)工具罷了。這個(gè)工具雖然強(qiáng)大，但超越人類可沒(méi)那么容易。

　　今年五月份舉行的烏鎮(zhèn)圍棋峰會(huì)上，AlphaGo擊敗柯潔之后可以說(shuō)在圍棋界里已是“獨(dú)孤求敗”的境界了，幾乎無(wú)人是其對(duì)手。人們?cè)谫澷p的同時(shí)，也想看到是否會(huì)出現(xiàn)一個(gè)對(duì)手，能夠?qū)LphaGo拉下馬。

本文引用地址：http://m.butianyuan.cn/article/201710/370528.htm

　　事實(shí)就是這樣，越想著什么越會(huì)發(fā)生什么。ALphaGo終于遇到了自己的對(duì)手，這個(gè)對(duì)手甚至以摧枯拉朽之勢(shì)擊敗了ALphaGo。

　　就在上周，據(jù)外媒報(bào)道，英國(guó)DeepMind團(tuán)隊(duì)在《自然》雜志上發(fā)表了相關(guān)論文，介紹了新一代的圍棋AI：ALphaGo Zero。使用了強(qiáng)化學(xué)習(xí)技術(shù)的ALphaGo Zero可以通過(guò)自我對(duì)弈進(jìn)行訓(xùn)練，棋力大幅度增長(zhǎng)，輕輕松松擊敗了曾經(jīng)不可一世的ALphaGo。人們?cè)俅伪徽痼@了，就連柯潔都發(fā)出了“人類多余”的感嘆。

　　ALphaGo Zero到底是何方神圣?

　　可能有的人認(rèn)為，這沒(méi)有什么特別的。ALphaGo Zero是ALphaGo的強(qiáng)化版，比ALphaGo經(jīng)歷了更多的數(shù)據(jù)演練，打敗ALphaGo很正常。然而事實(shí)并不是這么簡(jiǎn)單。

　　在過(guò)去，AlphaGo都是使用專業(yè)人類棋手的對(duì)局?jǐn)?shù)據(jù)來(lái)進(jìn)行訓(xùn)練，可以說(shuō)是人類棋手的指導(dǎo)下，讓它一步步的成長(zhǎng)起來(lái)。而ALphaGo Zero完全不同，它采用了強(qiáng)化學(xué)習(xí)技術(shù)，從隨機(jī)對(duì)局開(kāi)始，不依靠任何人類專家的對(duì)局?jǐn)?shù)據(jù)或者人工監(jiān)管，而是讓其通過(guò)自我對(duì)弈來(lái)提升棋藝。

　　據(jù)了解，ALphaGo Zero經(jīng)過(guò)3天的訓(xùn)練，就已經(jīng)可以擊敗AlphaGo Lee(去年擊敗韓國(guó)頂尖棋手李世石的系統(tǒng))，比分為100比0。經(jīng)歷40天訓(xùn)練后，它總計(jì)運(yùn)行了大約2900萬(wàn)次自我對(duì)弈，又擊敗AlphaGo Master(今年擊敗世界冠軍柯潔的系統(tǒng))，且比分為89比11。要是說(shuō)ALphaGo對(duì)陣人類只是略勝一籌，那對(duì)陣ALphaGoZero簡(jiǎn)直就是被碾壓的局面。

　　DeepMind團(tuán)隊(duì)表示，ALphaGo Zero之所以那么強(qiáng)，原因在于它采取的強(qiáng)化學(xué)習(xí)技術(shù)。他們發(fā)現(xiàn)AlphaGo Zero自我對(duì)弈僅幾十天，就掌握了人類幾百年來(lái)來(lái)研究出來(lái)的圍棋技術(shù)。由于整個(gè)對(duì)弈過(guò)程沒(méi)有采用人類的數(shù)據(jù)，因此ALphaGo Zero的棋路獨(dú)特，不再拘泥于人類現(xiàn)有的圍棋理論。

　　何謂強(qiáng)化學(xué)習(xí)技術(shù)?

　　到底什么是強(qiáng)化學(xué)習(xí)技術(shù)呢?簡(jiǎn)單地說(shuō)，強(qiáng)化學(xué)習(xí)就是讓AI從中學(xué)習(xí)到能夠獲得最大回報(bào)的策略。AlphaGo Zero的強(qiáng)化學(xué)習(xí)主要包含兩個(gè)部分，蒙特卡洛樹(shù)搜索算法與神經(jīng)網(wǎng)絡(luò)算法。

　　在這兩種算法中，神經(jīng)網(wǎng)絡(luò)算法可根據(jù)當(dāng)前棋面形勢(shì)給出落子方案，以及預(yù)測(cè)當(dāng)前形勢(shì)下哪一方的贏面較大;蒙特卡洛樹(shù)搜索算法則可以看成是一個(gè)對(duì)于當(dāng)前落子步法的評(píng)價(jià)和改進(jìn)工具，它能夠模擬出AlphaGo Zero將棋子落在哪些地方可以獲得更高的勝率。

　　AlphaGo Zero的自我強(qiáng)化學(xué)習(xí)，圖片源自Nature

　　假如AlphaGo Zero的神經(jīng)網(wǎng)絡(luò)算法計(jì)算出的落子方案與蒙特卡洛樹(shù)搜索算法輸出的結(jié)果越接近，則勝率越大，即回報(bào)越高。因此，每落一顆子，AlphaGo Zero都要優(yōu)化神經(jīng)網(wǎng)絡(luò)算法中的參數(shù)，使其計(jì)算出的落子方案更接近蒙特卡洛樹(shù)搜索算法的結(jié)果，同時(shí)盡量減少勝者預(yù)測(cè)的偏差。

　　剛開(kāi)始，AlphaGo Zero的神經(jīng)網(wǎng)絡(luò)完全不懂圍棋，只能盲目落子。但經(jīng)歷無(wú)數(shù)盤(pán)自我對(duì)弈后，AlphaGo Zero終于從圍棋菜鳥(niǎo)成長(zhǎng)為了一代棋神。

　　AI雖強(qiáng)，但超越人類可沒(méi)那么容易

　　我們可以看到，ALphaGo Zero與它的前任相比，技術(shù)上實(shí)現(xiàn)了質(zhì)的飛躍。DeepMind團(tuán)隊(duì)也表示，希望通過(guò)培養(yǎng)AI自主學(xué)習(xí)的能力，來(lái)解決更多其他領(lǐng)域目前無(wú)法解決的棘手問(wèn)題。但是仍有很多人對(duì)于AlphaGo Zero的這種進(jìn)化表示了深切的擔(dān)憂。

　　美國(guó)加州伯克利大學(xué)博士@Ent_evo就專門(mén)針對(duì)ALphaGo Zero發(fā)表了一篇博文，在文中評(píng)論道：這對(duì)人類來(lái)說(shuō)是個(gè)很大的打擊。當(dāng)年AlphaGo至少還學(xué)習(xí)了大量的人類經(jīng)驗(yàn)，但是AlphaGo Zero根本就不需要人類棋手這么多年的積累，人類經(jīng)驗(yàn)是好是壞，對(duì)AI而言完全無(wú)關(guān)，這是所有AI末世中最令人恐懼的一個(gè)場(chǎng)景。

　　這不禁讓人想起著名物理學(xué)家斯蒂芬?霍金在2017全球移動(dòng)互聯(lián)網(wǎng)大會(huì)(GMIC)發(fā)表的演講。他表示，人工智能的崛起很有可能終結(jié)人類文明。

　　但是也有不少業(yè)內(nèi)人士對(duì)此表示不用擔(dān)心。新松機(jī)器人總裁曲道奎在接受媒體采訪時(shí)表示，Zero的分量被夸大了，這次突破只能算人工智能在圍棋領(lǐng)域的勝利，但要完成超越人類其他行業(yè)的水平卻為時(shí)尚早。就技術(shù)層面而言，Zero解決了圍棋問(wèn)題，但更多的問(wèn)題比如自然語(yǔ)言理解、圖像理解、推理等問(wèn)題仍然存在。

　　在筆者看來(lái)，ALphaGo Zero的誕生帶來(lái)了許多積極意義。它從零開(kāi)始，證明了“算法優(yōu)先于數(shù)據(jù)”這條長(zhǎng)期以來(lái)一直爭(zhēng)論的觀點(diǎn);它能夠擺脫對(duì)人類的依賴，不需要人類給出樣本數(shù)據(jù)，這為廣泛的行業(yè)應(yīng)用提供了更多可能。

　　雖然人工智能如此強(qiáng)大，但是“人類多余”的言論還是說(shuō)的過(guò)于嚴(yán)重了。即使ALphaGo Zero是通過(guò)自我學(xué)習(xí)進(jìn)行成長(zhǎng)，但是它依然沒(méi)有屬于自己的思維能力。歸根結(jié)底，AI也只不過(guò)是由人類為了某些需求而用技術(shù)加持的一個(gè)工具罷了。這個(gè)工具雖然強(qiáng)大，但超越人類可沒(méi)那么容易。

新聞中心

人類多余？AI想超越人類可沒(méi)那么容易

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

人類多余？AI想超越人類可沒(méi)那么容易

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

人類多余？AI想超越人類可沒(méi)那么容易