玩橋牌,8位人類世界冠軍,都輸給了AI
來源丨學(xué)術(shù)頭條日前,人工智能(AI)再次戰(zhàn)勝了人類。
這一次,人工智能沒有玩跳棋、國際象棋或者圍棋,也沒有玩《星際爭霸》《GT 賽車》或者奧數(shù)題,而是玩了一種更具娛樂性的紙牌游戲——橋牌。
圖|1942 年,美國夏默學(xué)院的一個橋牌俱樂部(來源:維基百科)
據(jù)英國《衛(wèi)報》(The Guardian)報道,在法國巴黎,一個名為 Nook 的人工智能在上周舉辦的橋牌比賽中擊敗了 8 位橋牌世界冠軍。
這一勝利對人工智能行業(yè)來說是一個新的里程碑,因?yàn)?Nook 在使用不完全信息的情況下,必須對其他幾個人類玩家的行為做出反應(yīng),這種情況更接近于“做出人類一般的決策”。
盡管此前人工智能已經(jīng)在國際象棋和圍棋等方面擊敗了人類,但當(dāng)時的人工智能玩家每次只有一個對手,而且人機(jī)雙方都擁有所有的信息。
可解釋的人工智能
橋牌是一種以技巧贏取牌墩的紙牌游戲,屬于吃墩游戲,是惠斯特(另一種紙牌游戲)的延伸,是世界上最流行的紙牌游戲之一,在老年人群中尤為流行。
橋牌是由四個人組成兩對搭檔在方桌上進(jìn)行,搭檔互相面對面坐在桌子的兩端。
一節(jié)橋牌包含許多副牌,而一副牌的進(jìn)行順序是先發(fā)牌,接著進(jìn)行叫牌決定定約,然后打牌,最后登記該牌的結(jié)果。一副牌的目標(biāo)是以手上發(fā)到的牌盡可能取得好成績。
這一次,在一個名為“The NukkAI challenge”的橋牌比賽中,與人類冠軍擁有同樣的****牌和同樣的對手的 Nook,在 80 次比賽中有 67 次的表現(xiàn)要好于人類冠軍。
圖|比賽畫面(來源:YouTube)
對此,人工智能研究員、NukkAI 聯(lián)合創(chuàng)始人之一 Véronique Ventos 表示,NooK 是“新一代人工智能”,因?yàn)樗茉谶M(jìn)行決策時做出解釋?!霸跇蚺浦?,如果你不做出解釋,就無法繼續(xù)玩下去?!?br />
倫敦帝國學(xué)院(Imperial College London)教授斯 Stephen Muggleton 認(rèn)為,這一勝利“代表了人工智能領(lǐng)域取得了根本性的重要進(jìn)展”。
(來源:《衛(wèi)報》)
近年來,可解釋性是人工智能領(lǐng)域的一個熱門話題。
當(dāng)前我們聽到的大多數(shù)關(guān)于機(jī)器學(xué)習(xí)的進(jìn)展都是基于像 AlphaGo 這樣的黑盒子系統(tǒng),這樣的人工智能是無法向人類解釋決策是如何做出的。
而 NooK 則代表了一種“白盒子”或“神經(jīng)符號”方法,它不是通過玩數(shù)十億輪游戲來學(xué)習(xí),而是首先學(xué)習(xí)游戲規(guī)則,然后通過練習(xí)來改進(jìn)游戲,是基于規(guī)則和深度學(xué)習(xí)系統(tǒng)的結(jié)合體,學(xué)習(xí)方式更接近人類。
布朗大學(xué)計算機(jī)科學(xué)教授 Michael Littman 表示,即使一個人或人工智能無法用語言解釋他們在做什么,他們的行為也需要“清晰易懂”,這對健康和工程等領(lǐng)域至關(guān)重要,比如即將通過路口的自動駕駛汽車,就需要能夠讀取其他車輛的行為。
但 Littman 也表示,這次人家大戰(zhàn)過程也有不足之處,因?yàn)檎麄€比賽過程沒有競價(也可稱為叫牌)過程,而競價是橋牌中最有趣的交流和欺騙發(fā)生的環(huán)節(jié)。
但在橋牌世界冠軍、NooK 此次的對手之一 Nevena Senior 看來,NooK 比人類更能解讀對手,更能利用對手的錯誤,NooK 的創(chuàng)造者們做了一件“了不起的”工作。
“這是人類在積累了足夠的經(jīng)驗(yàn)后才會做的事情。機(jī)器人能模仿人類的技能,讓我十分驚喜。”
“人機(jī)博弈”大盤點(diǎn)
自人工智能誕生以來,其與人類之間的 PK 就從未間斷。
30 年前,也就是 1992 年,國際跳棋人工智能程序奇努克首次挑戰(zhàn)了被譽(yù)為“世界上最好的”跳棋世界冠軍廷斯利。然而令人遺憾的是,奇努克落敗了。
但兩年之后,奇努克重振旗鼓,再次向廷斯利發(fā)起挑戰(zhàn),在雙方打了 6 局平手之后,廷斯利因病退賽,奇努克獲得冠軍。
這是人工智能歷史上第一次在競技游戲中獲得官方世界冠軍。
但奇努克前進(jìn)的腳步并未停下,2007 年 4 月,奇努克終極程序問世,成為了國際跳棋領(lǐng)域不可能被擊敗的存在。
1996 年的冬天,首次國際象棋人機(jī)大戰(zhàn)在美國費(fèi)城上演。IBM 公司的超級計算機(jī)“深藍(lán)”與棋王卡斯帕羅夫進(jìn)行了 6 局人機(jī)對弈。最終,卡斯帕羅夫以 4:2 的總比分戰(zhàn)勝了“深藍(lán)”。
這一次,人類捍衛(wèi)了自己的尊嚴(yán)。
然而,僅僅過了一年,1997 年 5 月,經(jīng)過改進(jìn)后的超級計算機(jī)“深藍(lán)”就再次向卡斯帕羅夫發(fā)起了挑戰(zhàn)。6 局戰(zhàn)罷,卷土重來的“深藍(lán)”以兩勝一負(fù)三平的戰(zhàn)績戰(zhàn)勝了棋王。
這是人工智能首次在標(biāo)準(zhǔn)比賽時限內(nèi)擊敗國際象棋世界冠軍。
但在今天看來,“深藍(lán)”還算不上足夠智能,其缺陷是沒有直覺,不具備真正的“智能靈魂”,只能靠超強(qiáng)的計算能力來彌補(bǔ)分析思考方面的缺陷。
直到 2016 年 3 月,另一場“人機(jī)大戰(zhàn)”震驚了世界。
由谷歌旗下人工智能公司 DeepMind 研發(fā)的 AlphaGo 以 4:1 的大比分,擊敗了當(dāng)時的圍棋世界冠軍李世石,成為了第一個戰(zhàn)勝圍棋世界冠軍的人工智能。
這一事件被認(rèn)為是人工智能行業(yè)真正意義上的里程碑。
從技術(shù)上講,通過使用蒙特卡洛樹搜索與兩個深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,AlphaGo 可以像人類大腦一樣自發(fā)學(xué)習(xí),進(jìn)行分析訓(xùn)練,不斷學(xué)習(xí)提高棋力。
一年后,在中國烏鎮(zhèn)圍棋峰會上,AlphaGo 以 3:0 的總比分,又戰(zhàn)勝了當(dāng)時排名世界第一的世界圍棋冠軍柯潔。
自此之后,在電子競技、編程和生命科學(xué)等領(lǐng)域,各類人工智能也如雨后春筍般涌現(xiàn)。
比如,2018 年 12 月 10 日,DeepMind 針對即時戰(zhàn)略游戲《星際爭霸》開發(fā)的 AlphaStar 完虐了世界上 99.8% 的人類職業(yè)選手。
今年 2 月,DeepMind 又創(chuàng)建了一個名為 AlphaCode 的 AI 系統(tǒng),并宣稱該系統(tǒng)的“編程能力能與一般人類程序員相競爭”。
同月,由索尼人工智能團(tuán)隊(duì)研發(fā)的人工智能程序,在賽車游戲《GT賽車》中,也戰(zhàn)勝了世界冠軍級人類玩家。
如今的人工智能,已經(jīng)深入到了我們?nèi)粘I?、學(xué)習(xí)和工作的方方面面,在某些特定任務(wù)中有著比肩甚至超越人類的能力。
因此,有些人會擔(dān)憂,能力越來越強(qiáng)的人工智能系統(tǒng),會不會在未來的某一天進(jìn)化出自己的意識,進(jìn)而超越人類,甚至做出更可怕的事情。
事實(shí)上,人工智能的優(yōu)勢在于超強(qiáng)的記憶力、計算能力等方面,并且能夠在極端條件下無休止工作。在這一點(diǎn)上,目前的人工智能確實(shí)在很多領(lǐng)域超越了人類。
但從技術(shù)層面來說,目前的人工智能系統(tǒng)是在給定的數(shù)據(jù)和指定的規(guī)則下進(jìn)行自主學(xué)習(xí)或者人工矯正,可以在特定參數(shù)下解決特定問題。一旦引入一個變量,系統(tǒng)可能就會崩潰,或者需要創(chuàng)建一個新的模型,離科幻電影中描述的場景,還相去甚遠(yuǎn)。
人類和人工智能都擁有不同的能力和優(yōu)勢。人工智能無法擁有許多人類獨(dú)有的能力和特性,比如情感意識和創(chuàng)造力等,人類也不能像人工智能那樣,具備超強(qiáng)的記憶力和計算力,以及無休止工作的能力。
因此,我們真正需要關(guān)心的問題是,如何讓人工智能與人類更好地協(xié)作。
無論如何,不可否認(rèn)的是,人工智能確實(shí)改變了一些東西。
參考鏈接:
https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://en.wikipedia.org/wiki/Contract_bridge
https://challenge.nukk.ai/
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。