圍棋人機大戰(zhàn)一周年：被AlphaGo改變的世界

作者：時間：2017-03-14 來源：創(chuàng)事記

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

編者按：四月，新的人機大戰(zhàn)又要啟幕了。好戲又要上演，而未來的人機大戰(zhàn)，勢必不止于圍棋。

　　去年今日，三連敗的李世乭扳回一局。

本文引用地址：http://m.butianyuan.cn/article/201703/345183.htm

　　然而這一針興奮劑很快失效，隨后李世乭再折一陣，最終以1:4輸給AlphaGo。在圍棋的人機大戰(zhàn)中，頂級人類選手完敗給人工智能。

　　人工智能一戰(zhàn)成名，李世乭留下落寞側影。為AlphaGo落子的黃士杰一年后回憶說：“當時我代表AlphaGo下棋，必須保持冷靜”。

　　從那時起到現(xiàn)在，人類始終生活在一個被AlphaGo改變的世界。

　　一年回望

　　站在圍棋人機大戰(zhàn)一周年的節(jié)點上，該如何回顧過去、展望未來呢?量子位先把幾個問題拋給創(chuàng)新工場AI工程院副院長王詠剛。

　　量子位：一年后再看AlphaGo有何改變?有什么記憶猶新的片段?

　　王詠剛：AlphaGo出世一年，其實進入大家視野的是三個版本：5:0擊敗樊麾的內(nèi)測版本，4:1擊敗李世石的版本，以Master網(wǎng)名60:0快棋挑落中日韓高手的版本。三個版本演進脈絡明顯，每次迭代都有重大升級。

　　最震撼的是計算機在人類傳統(tǒng)認為極其玄妙的、電腦無法掌握的“大局觀”上突飛猛進，遠遠將人類選手甩在身后。電腦計算“大局觀”的方式，和人類培養(yǎng)“大局觀”的思路，有根本的差別。人類沒可能在這方面趕上電腦。

　　和樊麾對局的棋譜基本上還看不出AlphaGo的大局觀有多強，和李世石對局就下出了聶衛(wèi)平贊不絕口的五路肩沖，到了Master的60局，大局觀體現(xiàn)在兩個地方：

　　1)從始至終對局勢的把握，比如第60局古力用AlphaGo的思路對付AlphaGo，把中央撐得很滿，但AlphaGo不緊不慢，總是恰到好處地保持勝勢。

　　2)已經(jīng)深刻影響人類對布局的思考，大飛守角之類的變化迅速被人類棋手模仿，這和當年深藍問世后，國際象棋的布局革命是一樣的。

　　量子位：過去一年，有什么具體產(chǎn)品或研究，是基于AlphaGo的么?

　　王詠剛：AlphaGo用的是AI領域應用非常普遍的算法：深度學習、蒙特卡洛算法、增強學習等。

　　從概念上可以說，機器視覺相關的深度學習技術，包含環(huán)境-決策-反饋的智能系統(tǒng)，里面都有AlphaGo的影子。當然，直接的代碼實現(xiàn)層面，肯定沒有復制、粘貼這樣直接借用的關系，因為AlphaGo的深度學習模型畢竟是圍繞圍棋的特征建立的。

　　DeepMind去年發(fā)布的讀唇術LipNet，與英國國家醫(yī)療服務體系NHS合作推出的醫(yī)療輔助應用Streams，與眼科醫(yī)院合作幫助眼部疾病診斷等等，可以說都是與AlphaGo同源的技術。

　　量子位：AlphaGo是否已經(jīng)攻克圍棋?未來可提升的空間還有哪些?

　　王詠剛：“攻克圍棋”，如果說戰(zhàn)勝人類選手的話，AlphaGo已經(jīng)實現(xiàn)了，而且現(xiàn)在“絕藝”，DeepZen之類的程序?qū)θ祟悇俾室埠芨吡恕?/p>

　　未來最多三年必將發(fā)生的是，手機上的本地APP就可以戰(zhàn)勝人類職業(yè)高手，現(xiàn)在熱鬧的網(wǎng)上圍棋對弈平臺都會死掉(因為對手可以輕易用手機作弊)，人類圍棋將回歸現(xiàn)場競賽，圍棋培訓講師將更重視普及教育，因為中高級的提高訓練完全可以用機器代練。

　　不過，如果說“攻克圍棋”是像計算機可以窮舉西洋跳棋的所有變化那樣，讓電腦成為圍棋“上帝”，這個應該還不大可能。現(xiàn)在AI大部分的招數(shù)，還在人類高手可以理解的范疇內(nèi)。AI也有一些可疑的“弱點”，比如官子水平到底如何等等。

　　以后AI和AI之間的競賽，應該會不斷促進AI提高(但這種沒有太多商業(yè)利益的事情，有沒有持續(xù)投入是個問題)。人類應該望塵莫及，但可以不斷從AI中學習新的思想。

　　不止下棋

　　“AlphaGo給大家最大啟發(fā)，不是贏棋，而是如何構建一個智商超過300的機器”，HTC負責研發(fā)及醫(yī)療的總裁、原Google中國工程院副院長張智威說。

　　構建的方法有兩個：一是訓練、二是數(shù)據(jù)。張智威最近在清華的一次分享(傳送門)中說，“如果能做好這件事，各位都是億萬富翁。最近兩年，我們每天都在想，哪些領域可以拿到無限的數(shù)據(jù)”。

　　而在AAAI Fellow、IEEE Fellow、香港科技大學楊強教授看來，DeepMind在創(chuàng)造AlphaGo的過程中，引入一個新的概念：利用深度學習+強化學習，來判斷現(xiàn)狀和預測未來。這與未來的商業(yè)模式有著明確的關聯(lián)：

　　通過對大數(shù)據(jù)的分析，對現(xiàn)實的判斷和對商業(yè)未來走向進行預估。

　　楊強還試圖基于AlphaGo歸納出一套人工智能的應用流程：算法的目標是什么?有沒有數(shù)據(jù)?數(shù)據(jù)在哪里?問題的邊界是否清晰?什么叫合理的走法、什么叫犯規(guī)的走法?你的特征在哪里?又如何得到這些特征?是否可以得到一個持續(xù)的反饋?

　　但也有人沿著另一條路前進。

　　圍棋也好、國際象棋也好、國際跳棋也好，所有這些都是完美信息博弈。現(xiàn)實世界中，不完美信息才是常態(tài)，各種看不見的隱藏信息產(chǎn)生了大量的不確定性，而德州撲克代表的就是這種類型的博弈。

　　今年初，在德州撲克的人機大戰(zhàn)中，人工智能Libratus擊敗了四位頂級人類玩家。創(chuàng)造了這個AI的卡內(nèi)基梅隆大學Sandholm教授說，能夠處理不完美信息的AI，未來可以用于商業(yè)談判、網(wǎng)絡安全、醫(yī)療方案制定等領域。

　　人工智能發(fā)展的終極目標，是通用人工智能(AGI)。通用人工智能可以解決任何一個問題。想要實現(xiàn)AGI就得讓人工智能學會解決不確定性問題，這也是德州撲克人機大戰(zhàn)的重大意義之一。

　　對于已屆不惑的Demis Hassabis來說，創(chuàng)立DeepMind的目標絕不僅限于創(chuàng)造AlphaGo。過去的一年里，DeepMind還搞出了很多有意思的創(chuàng)新。

　　比方說可以模擬任意一種人類聲音的WaveNet;以及與英國國家醫(yī)療服務體系合作，使用人工智能來改善醫(yī)療行業(yè)等。

　　繼續(xù)戰(zhàn)斗

　　過去的一年里，僅僅在圍棋界，出彩的人工智能就不止AlphaGo一家。比方說量子位此前報道過的首個圍棋十段：騰訊絕藝(傳送門)，就是一個AI。

　　而對于AlphaGo來說，挑戰(zhàn)也還沒結束。

　　現(xiàn)在的圍棋江湖里，中日韓三強中，無疑中國軍團占據(jù)了絕對的優(yōu)勢。剛剛結束的第18屆農(nóng)心杯三國圍棋擂臺賽上，中國隊僅上場兩位選手，就將日韓兩隊悉數(shù)全滅。連笑、柁嘉熹、柯潔等重量級棋手尚未登場，就已經(jīng)拿下冠軍。

　　不在正式場合對陣世界排名第一的柯潔，對于AlphaGo來說始終不夠完美。去年AlphaGo挑戰(zhàn)李世乭前，各方還就誰贏誰輸打賭。

　　當時《連線》記者在報道中描述道：

　　一位名叫周峰的中國記者在觀戰(zhàn)室攔下了我，開心地和我這種將AlphaGo視為科技奇跡而非圍棋殺手的人進行對話。

　　但是當我詢問看見李世石輸了比賽他作何感想時，他指著心口說：“我很難過?！?/p>

　　量子位很想問問，如果柯潔這次也輸給AlphaGo，周峰還會特別難過么?

　　這一次，在人工智能和人類頂級高手之間，你覺得誰會贏呢?

　　“我們不關心輸贏。輸贏其實不用看的，AI想贏它就肯定能贏”，云從CEO周曦說，“關鍵問題是AlphaGo會不會有些新的想法”。

新聞中心

圍棋人機大戰(zhàn)一周年：被AlphaGo改變的世界

評論

相關推薦

技術專區(qū)