最新研究：超級(jí)人工智能，從理論上就無(wú)法控制

作者：時(shí)間：2021-01-21 來(lái)源：機(jī)器之心Pro

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

計(jì)算的能力是有極限的，但因此，人類無(wú)法控制超級(jí)人工智能。

本文引用地址：http://m.butianyuan.cn/article/202101/422285.htm

近日，一項(xiàng)新的研究發(fā)現(xiàn)，從理論上來(lái)看，人類不可能控制超級(jí)人工智能。更為糟糕的是，這項(xiàng)研究也明確了人類無(wú)法在這種 AI 生成之時(shí)發(fā)現(xiàn)它。

讓人稍稍感到安慰的是，根據(jù)不止一項(xiàng)預(yù)測(cè)，任何通用超級(jí)計(jì)算機(jī)超越人類的時(shí)間都會(huì)在數(shù)十年以后。

最近幾年，人工智能在國(guó)際象棋、圍棋、德州撲克、Jeopardy 等游戲上超越了人類，在 Dota2、星際爭(zhēng)霸游戲中和頂級(jí)玩家打得有來(lái)有回，時(shí)不時(shí)會(huì)引起一小陣恐慌，有人擔(dān)心超越人類的機(jī)器智能會(huì)在某一天讓人們無(wú)所適從。「有關(guān)超級(jí)智能是否接受人類控制的問(wèn)題其實(shí)很古老，」西班牙馬德里自治大學(xué)計(jì)算機(jī)科學(xué)家 Manuel Alfonseca 說(shuō)道，「這還得追溯到 20 世紀(jì) 40 年代的阿西莫夫的機(jī)器人三定律。」

與超級(jí)人工智能展開(kāi)任何形式的交流都是有風(fēng)險(xiǎn)的。

人們耳熟能詳?shù)臋C(jī)器人三定律，首先在科幻小說(shuō)家伊薩克 · 阿西莫夫在 1942 年的短篇小說(shuō)集《我，機(jī)器人》中被提出，規(guī)則如下：

機(jī)器人不得傷害人類，或坐視人類受到傷害；

機(jī)器人必須服從人類命令，除非命令與第一法則發(fā)生沖突；

在不違背第一或第二法則之下，機(jī)器人可以保護(hù)自己。

在 1985 年《機(jī)器人與帝國(guó)》書中，阿西莫夫?qū)⑷蠓▌t擴(kuò)張為四大法則：加入第零法則——機(jī)器人不得傷害整體人類，或坐視整體人類受到傷害。

2014 年，牛津大學(xué)人類未來(lái)研究所（Future of Humanity Institute ）主任、哲學(xué)家 Nick Bostrom 不僅探索了超級(jí)人工智能破壞人類的方式，還研究了針對(duì)這類機(jī)器可能的控制策略以及它們無(wú)法奏效的原因。

Bostrom 列舉了這一「控制問(wèn)題」的兩種可能解決方案。一種是控制 AI 能做的事情，如阻止 AI 連接互聯(lián)網(wǎng)；另一種是控制 AI 想做的事情，如教授 AI 規(guī)則和價(jià)值觀，使其秉持人類利益最大的原則行動(dòng)。Bostrom 認(rèn)為，第一種解決方案存在的問(wèn)題是超級(jí)智能機(jī)器可能掙脫任何人類施加給它的限制；第二種解決方案則擔(dān)心人類可能沒(méi)有能力訓(xùn)練出超級(jí)人工智能。

計(jì)算固有的限制可能導(dǎo)致人類無(wú)法控制超級(jí)人工智能

在本月初發(fā)表在 AI 領(lǐng)域頂級(jí)期刊《人工智能研究雜志》（JAIR）上的一篇文章中，馬德里自治大學(xué)、馬克斯 - 普朗克人類發(fā)展研究所等機(jī)構(gòu)的研究者認(rèn)為，由于計(jì)算本身固有的基本限制，人類可能無(wú)法控制超級(jí)人工智能。

他們表示，任何旨在確保超級(jí)人工智能無(wú)法傷害人類的算法都必須首先模擬機(jī)器行為以預(yù)測(cè)其行動(dòng)的潛在后果。如果超級(jí)智能機(jī)器確實(shí)可能造成傷害，那么此類抑制算法（containment algorithm）需要停止機(jī)器的運(yùn)行。

然而，科學(xué)家們認(rèn)為，任何抑制算法都不可能模擬 AI 的行為，也就無(wú)法百分之百地預(yù)測(cè) AI 的行為是否會(huì)造成傷害。抑制算法可能無(wú)法正確模擬 AI 的行為或準(zhǔn)確預(yù)測(cè) AI 行動(dòng)的后果，也就無(wú)法分辨出這些失敗。

論文地址：https://jair.org/index.php/jair/article/view/12202/26642

「阿西莫夫給出的第一定律實(shí)際上已被證明是無(wú)法計(jì)算的，」Alfonseca 說(shuō)道，「因而根本無(wú)法實(shí)現(xiàn)?！?/p>

我們甚至連自己是否已經(jīng)創(chuàng)造了超級(jí)智能機(jī)器都不知道——這是可計(jì)算理論中萊斯定理的一個(gè)推論，該定理指出遞歸可枚舉語(yǔ)言的所有非平凡（nontrival）性質(zhì)都是不可判定的。從本質(zhì)上來(lái)說(shuō)，我們不能僅通過(guò)觀察程序本身，就知道程序可能會(huì)輸出什么。

當(dāng)然另一方面，我們還不需要為將來(lái)的機(jī)器人主宰提前做好服侍的準(zhǔn)備。在該研究中，有三個(gè)重要問(wèn)題給該論文的推論帶來(lái)了不確定性。

首先，Alfonseca 預(yù)計(jì)強(qiáng)人工智能的關(guān)鍵時(shí)刻還很遙遠(yuǎn)，他說(shuō)道：「至少還有兩個(gè)世紀(jì)?！?/p>

其次，人們所說(shuō)的通用人工智能，或強(qiáng)人工智能在理論上是否可行，其實(shí)也是未知數(shù)?！高@是指能像人類一樣能夠處理多個(gè)領(lǐng)域任務(wù)的機(jī)器?！?/p>

最后，Alfonseca 說(shuō)道：「我們還沒(méi)有證明超級(jí)人工智能永遠(yuǎn)無(wú)法控制，我只是說(shuō)它們不能被永遠(yuǎn)控制?！?/p>

計(jì)算復(fù)雜性是阻止人類控制強(qiáng)人工智能的重要原因。

盡管我們可能無(wú)法控制一個(gè)強(qiáng)人工智能體，但控制一個(gè)超越人類水平的狹義 AI 是可行的——我們可以放心地依賴一些專注于某些功能，而非像人類一樣可以執(zhí)行多種任務(wù)的機(jī)器人?！肝覀円呀?jīng)擁有這種超級(jí)智能，」Alfonseca 說(shuō)道?！咐缥覀儞碛锌梢员热祟愃俣瓤旌芏嗟挠?jì)算機(jī)器。這也是一種狹義的超級(jí)智能?！?/p>

選自spectrum.ieee

作者：Charles Q. Choi

機(jī)器之心編譯

編輯：澤南、杜偉

新聞中心

最新研究：超級(jí)人工智能，從理論上就無(wú)法控制

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

最新研究：超級(jí)人工智能，從理論上就無(wú)法控制

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

最新研究：超級(jí)人工智能，從理論上就無(wú)法控制