新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來何去何從?

柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來何去何從?

作者: 時間:2017-05-24 來源:網(wǎng)易智能 收藏
編者按:拼盡全力的柯潔,也只能望洋興嘆,AlphaGo對棋的理解和判斷已經(jīng)高于我們(人類)了。

  職業(yè)女子棋手和評論員徐瑩在今天比賽的評述中說到:“自從 出現(xiàn)之后,突然圍棋變得五彩斑瀾了,我們感覺思路一下子打開了, 這種自由自在的行棋風(fēng)格,恰恰是我們一直所追求的圍棋本質(zhì)。”

本文引用地址:http://m.butianyuan.cn/article/201705/359624.htm

  Michael Redmond九段點評說,的棋風(fēng)如何激發(fā)人類棋手挑戰(zhàn)創(chuàng)新的邊界,并賦予一些傳統(tǒng)套路新的生命?!翱聺嵲陂_局階段就使用了他從早前Master連勝系列中學(xué)習(xí)到的下法,并和自己的風(fēng)格融合到了一起?!?/p>

  正如哈薩比斯所說,“再過一萬年,我們也不能窮盡所有的打法。”但是,圍棋的探索從未停止。

AlphaGo有哪些蛻變,2.0之后何去何從?

哈薩比斯今日透露,目前的AlphaGo是在云端由單TPU運行,這與Goolge上周在I/O大會上剛公布的芯片版本一致。TPU是專門為機器學(xué)習(xí)而設(shè)計的處理器。與去年3月與李世石的比賽時相比,當(dāng)前的版本在處理計算時所消耗的能量僅為過去的十分之一。


柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來何去何從?


  360研究院院長顏水成點評說,過去一年多,AlphaGo在學(xué)習(xí)方式和模型上有很大的變化和提升,實時比賽計算已經(jīng)用一個TPU就足夠。對于算法上的貢獻,三角獸科技首席科學(xué)家王寶勛說,毫無疑問的AlphaGo基于深度學(xué)習(xí)的搜索算法得到了進一步的優(yōu)化,走棋的效率更高,強化學(xué)習(xí)勢必比之前發(fā)揮的作用更大。但是Deepmind對于硬件和模型細節(jié)的把握同樣是不可忽視的因素。

  對于AlphaGo 2.0的技術(shù)進步,地平線機器人技術(shù)CEO余凱稱,這次AlphaGo 2.0的重要進展是,系統(tǒng)完全從零狀態(tài)開始通過自我博弈來學(xué)習(xí)和提升棋力的。而以前的1.0版本是有學(xué)習(xí)人類棋手歷史數(shù)據(jù)的。這種完全不需要外界數(shù)據(jù)的自我學(xué)習(xí),是人工智能很激動人心的一個進展。

  搜狗CEO王小川進一步解釋說,AlphaGo 1.0是巧妙地混合了蒙特卡洛樹搜索+監(jiān)督學(xué)習(xí)+增強學(xué)習(xí)三種算法。而此次AlphaGo2.0的技術(shù)原理與之前有著巨大不同,它放棄了放棄了監(jiān)督學(xué)習(xí);放棄了蒙特卡洛樹搜索,不再進行暴力計算;極大地強化了增強學(xué)習(xí)的作用,之前敲邊鼓的算法,正式成為扛把子主力。

  第四范式資深機器學(xué)習(xí)架構(gòu)師涂威威點評到,在底層架構(gòu)上,AlphaGo這一版性能相比去年有了一個量級的提升,不僅是訓(xùn)練速度提升,而且實際對弈的機器也從去年的多臺機器的集群變成了現(xiàn)在的單機,這點對實際應(yīng)用意義巨大,降低了使用門檻,同樣也使得在相同計算資源的情況下,可以支持更多的訓(xùn)練數(shù)據(jù)和維度更高的模型;Google在此之前也宣布了新版的TPU,打破了深度學(xué)習(xí)訓(xùn)練硬件上GPU的壟斷(更早公開的TPU只是被應(yīng)用在深度學(xué)習(xí)預(yù)估系統(tǒng)中),新版的AlphaGo可能也會受益于TPU技術(shù)的進步。算法細節(jié)上尚未公布,這一版可能對搜索策略和強化學(xué)習(xí)一些細節(jié)上進行調(diào)整,比如蒙特卡洛樹搜索和策略網(wǎng)絡(luò)結(jié)合來提升性能,以及上一版的AlphaGo自我博弈的啟發(fā)式策略(與前幾輪的自己進行對弈)并不收斂,我們猜測新版可能在這些方面會有所改進。

  涂威威重點提到,DeepMind已經(jīng)在嘗試讓AlphaGo有“舉一反三”的能力,這種觸類旁通的能力才是人類更為擅長的,這里就要用到遷移學(xué)習(xí)領(lǐng)域的技術(shù)。

  對于AlphaGo在比賽之后的發(fā)展,創(chuàng)始人哈薩比斯表示,我們在本周內(nèi)會告訴大家,并披露更多的技術(shù)細節(jié)。


柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來何去何從?


 人工智能能給人類帶來什么?

  雖然哈薩比斯沒有透露AlphaGo的去向,但是他在現(xiàn)場曾表示,我們利用人工智能可以解決目前的很多難題,比如醫(yī)療。我們希望AlphaGo與人類的合作可以找到更多的方式,我們希望AlphaGo在其他領(lǐng)域也能取得矚目的成就。

  達闥科技CEO黃曉慶說,AlphaGo贏柯潔是完全在意料之中,贏很小的優(yōu)勢也是意料之中,因為那是AlphaGo的設(shè)計方法,只需要保證贏就行?!斑@是對強人工智能技術(shù)的可能性的最強大的證明!”黃曉慶強調(diào)說。

  也許就是因為這種進步,DeepMind將開始探索人工智能在醫(yī)療等各個行業(yè)領(lǐng)域的應(yīng)用。

  海知智能(ruyi.ai)創(chuàng)始人兼CEO謝殿俠評點說,以AlphaGo為代表的人工智能應(yīng)用,在這場認知革命里只是一個小小里程碑。工業(yè)革命實現(xiàn)了體力工作自動化解放了體力勞動者,認知革命將知識工作自動化解放腦力勞動者。


柯潔首戰(zhàn)惜敗,但AlphaGo和AI未來何去何從?


  最后,智能菌相對大家說,比賽尚未結(jié)束,精彩還在繼續(xù),雖然變化打法仍沒有找到AlphaGo的弱點,但柯潔仍表示會盡全力去拼每一盤棋,作為觀眾我們何嘗不需要這種認真的精神呢?


上一頁 1 2 下一頁

關(guān)鍵詞: AlphaGo AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉