新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > AlphaGo增強(qiáng)版學(xué)會(huì)國(guó)際象棋和將棋 不到一天超越人類(lèi)水平

AlphaGo增強(qiáng)版學(xué)會(huì)國(guó)際象棋和將棋 不到一天超越人類(lèi)水平

作者: 時(shí)間:2017-12-07 來(lái)源:騰訊科技 收藏
編者按:人工智能技術(shù)已經(jīng)從棋類(lèi)項(xiàng)目中邁出了第一步。

  12月7日據(jù)國(guó)外媒體報(bào)道,谷歌旗下公司DeepMind一直都熱衷于在棋盤(pán)上擊敗所有人類(lèi)對(duì)手。雖然大部分時(shí)間關(guān)于技術(shù)的討論都是在無(wú)人駕駛汽車(chē)等領(lǐng)域,但是作為一種屬于未來(lái)的新技術(shù),其實(shí)可以應(yīng)對(duì)各種各樣的挑戰(zhàn)。雖然距離最終的目標(biāo)還有很長(zhǎng)的一段路,但是根據(jù)DeepMind公布的一項(xiàng)最新研究成果來(lái)看,人工智能至少已經(jīng)走在了正確的道路上。

本文引用地址:http://m.butianyuan.cn/article/201712/372727.htm

  在一篇最新論文中我們看到了DeepMind開(kāi)發(fā)的人工智能技術(shù)是如何在圍棋以外的領(lǐng)域繼續(xù)不斷超越人類(lèi)。這次的新技術(shù)AlphaZero在學(xué)習(xí)8個(gè)小時(shí)之后就成功的擊敗了之前“碾壓”人類(lèi)冠軍的前任。同時(shí)又只用4個(gè)小時(shí)的訓(xùn)練就能擊敗頂級(jí)的國(guó)際象棋引擎Stockfish。最后,又經(jīng)過(guò)2個(gè)小時(shí)的訓(xùn)練后擊敗了日本傳統(tǒng)棋類(lèi)項(xiàng)目將棋的Elmo引擎,三種棋類(lèi)都已經(jīng)超越了國(guó)際頂級(jí)水準(zhǔn)。

  這項(xiàng)技術(shù)的關(guān)鍵是名為AlphaZero的新一代人工智能程序,算是之前的增強(qiáng)版。其實(shí)這項(xiàng)技術(shù)并非是專(zhuān)門(mén)針對(duì)下棋設(shè)計(jì),雖然它能夠遵守基本的棋類(lèi)規(guī)則,但是并沒(méi)有專(zhuān)門(mén)的策略和戰(zhàn)術(shù)代碼。這項(xiàng)技術(shù)通過(guò)名為“強(qiáng)化學(xué)習(xí)”的訓(xùn)練方法,能夠通過(guò)不斷重復(fù)訓(xùn)練快速掌握規(guī)則。

  其實(shí)這種強(qiáng)化式學(xué)習(xí)方式本身并不新鮮。DeepMind工程師之前使用了同樣的方法在今年10月創(chuàng)建了 Zero。但是這次新的AlphaZero要比之前更具有通用性,因此能夠在沒(méi)有事先準(zhǔn)備的情況下應(yīng)用于更廣泛的用途。

  值得注意的是,在不到24小時(shí)的時(shí)間里,同一個(gè)計(jì)算機(jī)程序能夠通過(guò)自我學(xué)習(xí)的方式實(shí)現(xiàn)在三種不同棋類(lèi)項(xiàng)目同時(shí)達(dá)到“超越人類(lèi)”的水平,這是人工智能領(lǐng)域所取得的新成就。

  現(xiàn)在DeepMind距離公司夢(mèng)寐以求的通用思維機(jī)器目標(biāo)又近了一步,不過(guò)依然面對(duì)著非常大的挑戰(zhàn)。今年年初,DeepMind首席執(zhí)行官Demis Hassabis在展示最新成果時(shí)表示,雖然該技術(shù)未來(lái)可能對(duì)解決一系列科學(xué)問(wèn)題有所幫助,比如創(chuàng)新設(shè)計(jì)和藥品研發(fā),但是這些用途與棋類(lèi)游戲相比有本質(zhì)的區(qū)別。團(tuán)隊(duì)需要大量的工作來(lái)找出如何解決這些問(wèn)題的方式。



關(guān)鍵詞: AlphaGo 人工智能

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉