玩橋牌，8位人類世界冠軍，都輸給了AI

發(fā)布人：CV研究院時間：2022-04-14 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

作者 | 學(xué)術(shù)頭條

來源丨學(xué)術(shù)頭條日前，人工智能（AI）再次戰(zhàn)勝了人類。

這一次，人工智能沒有玩跳棋、國際象棋或者圍棋，也沒有玩《星際爭霸》《GT 賽車》或者奧數(shù)題，而是玩了一種更具娛樂性的紙牌游戲——橋牌。

圖｜1942 年，美國夏默學(xué)院的一個橋牌俱樂部（來源：維基百科）
據(jù)英國《衛(wèi)報》（The Guardian）報道，在法國巴黎，一個名為 Nook 的人工智能在上周舉辦的橋牌比賽中擊敗了 8 位橋牌世界冠軍。

這一勝利對人工智能行業(yè)來說是一個新的里程碑，因為 Nook 在使用不完全信息的情況下，必須對其他幾個人類玩家的行為做出反應(yīng)，這種情況更接近于“做出人類一般的決策”。

盡管此前人工智能已經(jīng)在國際象棋和圍棋等方面擊敗了人類，但當(dāng)時的人工智能玩家每次只有一個對手，而且人機(jī)雙方都擁有所有的信息。
可解釋的人工智能

橋牌是一種以技巧贏取牌墩的紙牌游戲，屬于吃墩游戲，是惠斯特（另一種紙牌游戲）的延伸，是世界上最流行的紙牌游戲之一，在老年人群中尤為流行。

橋牌是由四個人組成兩對搭檔在方桌上進(jìn)行，搭檔互相面對面坐在桌子的兩端。

一節(jié)橋牌包含許多副牌，而一副牌的進(jìn)行順序是先發(fā)牌，接著進(jìn)行叫牌決定定約，然后打牌，最后登記該牌的結(jié)果。一副牌的目標(biāo)是以手上發(fā)到的牌盡可能取得好成績。

這一次，在一個名為“The NukkAI challenge”的橋牌比賽中，與人類冠軍擁有同樣的****牌和同樣的對手的 Nook，在 80 次比賽中有 67 次的表現(xiàn)要好于人類冠軍。

圖｜比賽畫面（來源：YouTube）
對此，人工智能研究員、NukkAI 聯(lián)合創(chuàng)始人之一 Véronique Ventos 表示，NooK 是“新一代人工智能”，因為它能在進(jìn)行決策時做出解釋?！霸跇蚺浦?，如果你不做出解釋，就無法繼續(xù)玩下去?！?br />
倫敦帝國學(xué)院（Imperial College London）教授斯 Stephen Muggleton 認(rèn)為，這一勝利“代表了人工智能領(lǐng)域取得了根本性的重要進(jìn)展”。

（來源：《衛(wèi)報》）
近年來，可解釋性是人工智能領(lǐng)域的一個熱門話題。

當(dāng)前我們聽到的大多數(shù)關(guān)于機(jī)器學(xué)習(xí)的進(jìn)展都是基于像 AlphaGo 這樣的黑盒子系統(tǒng)，這樣的人工智能是無法向人類解釋決策是如何做出的。

而 NooK 則代表了一種“白盒子”或“神經(jīng)符號”方法，它不是通過玩數(shù)十億輪游戲來學(xué)習(xí)，而是首先學(xué)習(xí)游戲規(guī)則，然后通過練習(xí)來改進(jìn)游戲，是基于規(guī)則和深度學(xué)習(xí)系統(tǒng)的結(jié)合體，學(xué)習(xí)方式更接近人類。

布朗大學(xué)計算機(jī)科學(xué)教授 Michael Littman 表示，即使一個人或人工智能無法用語言解釋他們在做什么，他們的行為也需要“清晰易懂”，這對健康和工程等領(lǐng)域至關(guān)重要，比如即將通過路口的自動駕駛汽車，就需要能夠讀取其他車輛的行為。

但 Littman 也表示，這次人家大戰(zhàn)過程也有不足之處，因為整個比賽過程沒有競價（也可稱為叫牌）過程，而競價是橋牌中最有趣的交流和欺騙發(fā)生的環(huán)節(jié)。

但在橋牌世界冠軍、NooK 此次的對手之一 Nevena Senior 看來，NooK 比人類更能解讀對手，更能利用對手的錯誤，NooK 的創(chuàng)造者們做了一件“了不起的”工作。

“這是人類在積累了足夠的經(jīng)驗后才會做的事情。機(jī)器人能模仿人類的技能，讓我十分驚喜。”
“人機(jī)博弈”大盤點

自人工智能誕生以來，其與人類之間的 PK 就從未間斷。

30 年前，也就是 1992 年，國際跳棋人工智能程序奇努克首次挑戰(zhàn)了被譽為“世界上最好的”跳棋世界冠軍廷斯利。然而令人遺憾的是，奇努克落敗了。

但兩年之后，奇努克重振旗鼓，再次向廷斯利發(fā)起挑戰(zhàn)，在雙方打了 6 局平手之后，廷斯利因病退賽，奇努克獲得冠軍。

這是人工智能歷史上第一次在競技游戲中獲得官方世界冠軍。

但奇努克前進(jìn)的腳步并未停下，2007 年 4 月，奇努克終極程序問世，成為了國際跳棋領(lǐng)域不可能被擊敗的存在。

1996 年的冬天，首次國際象棋人機(jī)大戰(zhàn)在美國費城上演。IBM 公司的超級計算機(jī)“深藍(lán)”與棋王卡斯帕羅夫進(jìn)行了 6 局人機(jī)對弈。最終，卡斯帕羅夫以 4:2 的總比分戰(zhàn)勝了“深藍(lán)”。

這一次，人類捍衛(wèi)了自己的尊嚴(yán)。

然而，僅僅過了一年，1997 年 5 月，經(jīng)過改進(jìn)后的超級計算機(jī)“深藍(lán)”就再次向卡斯帕羅夫發(fā)起了挑戰(zhàn)。6 局戰(zhàn)罷，卷土重來的“深藍(lán)”以兩勝一負(fù)三平的戰(zhàn)績戰(zhàn)勝了棋王。

這是人工智能首次在標(biāo)準(zhǔn)比賽時限內(nèi)擊敗國際象棋世界冠軍。

但在今天看來，“深藍(lán)”還算不上足夠智能，其缺陷是沒有直覺，不具備真正的“智能靈魂”，只能靠超強的計算能力來彌補分析思考方面的缺陷。

直到 2016 年 3 月，另一場“人機(jī)大戰(zhàn)”震驚了世界。

由谷歌旗下人工智能公司 DeepMind 研發(fā)的 AlphaGo 以 4:1 的大比分，擊敗了當(dāng)時的圍棋世界冠軍李世石，成為了第一個戰(zhàn)勝圍棋世界冠軍的人工智能。

這一事件被認(rèn)為是人工智能行業(yè)真正意義上的里程碑。

從技術(shù)上講，通過使用蒙特卡洛樹搜索與兩個深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法，AlphaGo 可以像人類大腦一樣自發(fā)學(xué)習(xí)，進(jìn)行分析訓(xùn)練，不斷學(xué)習(xí)提高棋力。

一年后，在中國烏鎮(zhèn)圍棋峰會上，AlphaGo 以 3:0 的總比分，又戰(zhàn)勝了當(dāng)時排名世界第一的世界圍棋冠軍柯潔。

自此之后，在電子競技、編程和生命科學(xué)等領(lǐng)域，各類人工智能也如雨后春筍般涌現(xiàn)。

比如，2018 年 12 月 10 日，DeepMind 針對即時戰(zhàn)略游戲《星際爭霸》開發(fā)的 AlphaStar 完虐了世界上 99.8% 的人類職業(yè)選手。

今年 2 月，DeepMind 又創(chuàng)建了一個名為 AlphaCode 的 AI 系統(tǒng)，并宣稱該系統(tǒng)的“編程能力能與一般人類程序員相競爭”。

同月，由索尼人工智能團(tuán)隊研發(fā)的人工智能程序，在賽車游戲《GT賽車》中，也戰(zhàn)勝了世界冠軍級人類玩家。

如今的人工智能，已經(jīng)深入到了我們?nèi)粘Ｉ?、學(xué)習(xí)和工作的方方面面，在某些特定任務(wù)中有著比肩甚至超越人類的能力。

因此，有些人會擔(dān)憂，能力越來越強的人工智能系統(tǒng)，會不會在未來的某一天進(jìn)化出自己的意識，進(jìn)而超越人類，甚至做出更可怕的事情。

事實上，人工智能的優(yōu)勢在于超強的記憶力、計算能力等方面，并且能夠在極端條件下無休止工作。在這一點上，目前的人工智能確實在很多領(lǐng)域超越了人類。

但從技術(shù)層面來說，目前的人工智能系統(tǒng)是在給定的數(shù)據(jù)和指定的規(guī)則下進(jìn)行自主學(xué)習(xí)或者人工矯正，可以在特定參數(shù)下解決特定問題。一旦引入一個變量，系統(tǒng)可能就會崩潰，或者需要創(chuàng)建一個新的模型，離科幻電影中描述的場景，還相去甚遠(yuǎn)。

人類和人工智能都擁有不同的能力和優(yōu)勢。人工智能無法擁有許多人類獨有的能力和特性，比如情感意識和創(chuàng)造力等，人類也不能像人工智能那樣，具備超強的記憶力和計算力，以及無休止工作的能力。

因此，我們真正需要關(guān)心的問題是，如何讓人工智能與人類更好地協(xié)作。

無論如何，不可否認(rèn)的是，人工智能確實改變了一些東西。

參考鏈接：
https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://en.wikipedia.org/wiki/Contract_bridge
https://challenge.nukk.ai/