讓人工智能坐上副駕駛：智能協(xié)作能做到什么？

作者：時(shí)間：2018-04-24 來源：硅谷網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　當(dāng)人工智能可以幫助人類承擔(dān)一些工作時(shí)，我們總是把雙方的職責(zé)劃分的很清楚。人類工作時(shí)，很少看到人工智能的主動(dòng)參與，人工智能做事時(shí)，人類更是完全不插手。

本文引用地址：http://m.butianyuan.cn/article/201804/378890.htm

　　這一點(diǎn)最明顯的體現(xiàn)就在于輔助駕駛上，人類駕駛時(shí)輔助駕駛頂多會(huì)通過燈光閃爍、方向盤震動(dòng)來提示人類駕駛環(huán)境的變化，而不會(huì)主動(dòng)去掌握主動(dòng)權(quán)，影響汽車行動(dòng)的方向和速度。在輔助駕駛自動(dòng)泊車時(shí)，也會(huì)讓人類雙手離開方向盤。

　　其中的原因或許是人類的行為實(shí)在太千差萬別，如果引入智能解決方案之中會(huì)加更多的計(jì)算量。想象一下，在自動(dòng)泊車時(shí)人工智能認(rèn)為一個(gè)車位要倒兩把才能進(jìn)去，人類老司機(jī)卻認(rèn)為倒一把就能進(jìn)去，這種對(duì)問題解決方式設(shè)定的不同會(huì)讓雙方根本無法合作。

　　可如果人類可以在各個(gè)領(lǐng)域人工智能親密合作，會(huì)是怎樣一種景象?

　　從復(fù)制雙手到復(fù)制思想：人類和人工智能的合作史

　　關(guān)于人機(jī)合作這件事，我們已經(jīng)歷經(jīng)了很多年的研究，雙方合作的模式可以被分為三種類型。

　　第一類合作模式是主從操縱。

　　在40年代，人類為了研究不宜人體接觸的放射性物質(zhì)，研發(fā)出了一種主從機(jī)械手對(duì)其進(jìn)行遠(yuǎn)程操控。從機(jī)械手(或機(jī)器人)負(fù)責(zé)在不適宜人類前往的地方工作，通過傳感系統(tǒng)收集和傳達(dá)信息，而人類負(fù)責(zé)控制主機(jī)械手，將動(dòng)作映射到從機(jī)械手上，就形成了完美的遠(yuǎn)程操作。

　　如今這種方式已經(jīng)應(yīng)用在很多地方，水下機(jī)器人、手術(shù)機(jī)器人等等都是這種人機(jī)合作的成果。

　　可這樣的操作方式有著很多不便，比如動(dòng)作映射之間會(huì)有一定的誤差，從機(jī)器人傳感器收集來的信息也可能有一定的延遲，最后就會(huì)導(dǎo)致操作的低效。

　　于是出現(xiàn)了第二種人機(jī)合作模式——協(xié)作智能。

　　這種合作模式是讓人和自動(dòng)化的智能體一起協(xié)作，先讓智能體預(yù)測(cè)人的目標(biāo)，再來協(xié)助人實(shí)現(xiàn)這一目標(biāo)。就拿簡(jiǎn)單的分揀動(dòng)作來說，一張桌子上放置著不同形狀的物體，人類向正方體的方向伸出手，機(jī)械手就分揀出了所有的正方體。讀懂人類的目標(biāo)并完成目標(biāo)，這就是典型的協(xié)作智能。

　　可這種模式的問題在于，人類在工作時(shí)的想法往往是多變的——那些目標(biāo)流程單一，可以被套路化的工作早就被自動(dòng)化了，也用不上協(xié)作智能。那些可以從多種途徑實(shí)現(xiàn)的工作，卻需要對(duì)智能體進(jìn)行大量訓(xùn)練才能使其讀懂人類每一個(gè)動(dòng)作的意圖，于是協(xié)作智能在應(yīng)用上也遲遲沒有什么進(jìn)展。

　　第三種合作模式則是目前熱度很高的腦機(jī)接口，通過對(duì)腦電信號(hào)的讀取和解碼實(shí)現(xiàn)對(duì)器械的操控。這樣的方式雖然已經(jīng)和“讀懂人類意圖，協(xié)助實(shí)現(xiàn)目標(biāo)”非常接近。

　　但對(duì)于腦機(jī)接口我們此前也有過很多介紹，由于捕捉腦電信號(hào)十分困難，現(xiàn)在我們至多可以利用腦機(jī)接口完成一些非常簡(jiǎn)單的動(dòng)作，距離提升生產(chǎn)力效率還很遙遠(yuǎn)。

　　人工智能+人類，可不可能比人工智能更強(qiáng)?

　　這樣看來，第二種協(xié)作智能的模式更接近我們理想中的人機(jī)合作模式：智能體通過人類動(dòng)作、操作信號(hào)等等更明確同時(shí)也更容易理解的信息判斷人類目標(biāo)，同時(shí)擁有一定的自主性，不至于事事都讓人類親手教學(xué)。

　　最近伯克利的人工智能研究院推出了一篇論文，顯示了如何利用深度強(qiáng)化學(xué)習(xí)來增強(qiáng)協(xié)作智能的效果。

　　簡(jiǎn)單來說就是讓智能體和阿爾法狗一樣，把人類的動(dòng)作當(dāng)做“棋譜”大量輸入給神經(jīng)網(wǎng)絡(luò)，讓神經(jīng)網(wǎng)絡(luò)自行挖掘動(dòng)作和實(shí)現(xiàn)目標(biāo)之間的關(guān)系。在訓(xùn)練時(shí)，為神經(jīng)網(wǎng)絡(luò)加入獎(jiǎng)懲機(jī)制，每一次當(dāng)智能體幫助人類更接近一步目標(biāo)時(shí)，智能體就會(huì)獲得獎(jiǎng)勵(lì)，從而促使智能體越來越接近正確的合作模式。

　　在研究院的實(shí)驗(yàn)中，相比直接告訴智能體目標(biāo)，讓其自己尋找解決方案，這種讓智能體分辨人類目標(biāo)，和人類一起尋找解決方案的方式，訓(xùn)練時(shí)間會(huì)大大縮短，并且?guī)椭祟愅瓿勺约簾o法完成的事情。

　　舉例來講，研究員們測(cè)試了一款Lunar Lander的游戲，游戲目標(biāo)是操縱一輛從天而降左右搖晃的小車，使其降落在兩只旗幟中間。人類用鍵盤進(jìn)行這項(xiàng)游戲時(shí)很大幾率會(huì)以失敗告終，讓人工智能沖著目標(biāo)獨(dú)自摸索更是需要無窮盡的訓(xùn)練。但當(dāng)人類和人工智能合作時(shí)，僅需一段時(shí)間的訓(xùn)練，人工智能就可以幫助人類以各種姿勢(shì)實(shí)現(xiàn)目標(biāo)了。

　　讓人工智能坐上副駕駛，一起探索未知

　　協(xié)作智能給了我們一個(gè)提示：當(dāng)世界上出現(xiàn)人類和人工智能都無法單獨(dú)完成的工作時(shí)，我們應(yīng)該怎么辦?

　　這樣的問題絕對(duì)是大范圍存在的，就像阿爾法元經(jīng)過自我對(duì)弈進(jìn)行訓(xùn)練，打敗了用人類棋譜訓(xùn)練出的阿爾法狗一樣。很多時(shí)候我們自以為找到了最好的解決方案，只需悉數(shù)傳授給人工智能時(shí)，卻未曾想過這可能是一種自大。尤其在物理世界，人工智能無法像解決圍棋的數(shù)學(xué)問題一樣自己尋找解法。這時(shí)人類和人工智能的親密合作，或許才是最高效的解決方案。

　　可以應(yīng)用到協(xié)作智能的場(chǎng)景很多，比如在伯克利人工智能研究院的測(cè)試中，用降落無人機(jī)到指定地點(diǎn)為標(biāo)準(zhǔn)，人類獨(dú)自操作的速度、精準(zhǔn)度都要遠(yuǎn)遠(yuǎn)落后于于智能協(xié)作操作的速度和精準(zhǔn)度。人工智能就好像是人類的副駕駛，以另一種視角幫助人類更好的達(dá)成目標(biāo)。

　　換句話說，我們對(duì)輔助駕駛系統(tǒng)的種種不滿，或許都能用這種方式解決。例如自動(dòng)泊車不再僅僅限于奢侈的大車位，人類或許可以和人工智能一起嘗試在小車位中上演極限操作。不僅僅輔助駕駛，無人機(jī)操縱、工業(yè)自動(dòng)化……人類和人工智能的一切工作都可以通過這種方式達(dá)到更強(qiáng)的成果。

　　當(dāng)然，協(xié)作智能也并非是完全的解決方案。最典型的問題是其訓(xùn)練數(shù)據(jù)來自于人類與人工智能的協(xié)作操作，很難獲得現(xiàn)成的數(shù)據(jù)只能親手制造，所以對(duì)于駕駛、工業(yè)操作等等物理世界中的項(xiàng)目，需要耗費(fèi)極大的人力去訓(xùn)練人工智能。

　　但我們相信這些問題總會(huì)被一一解決，更重要的是我們要知道人類和人工智能是互相需要的。創(chuàng)造出一種技術(shù)僅僅為了使其替代自己，完成已知的工作是一種懶惰和愚蠢，雙方協(xié)作創(chuàng)造更多未知，才是技術(shù)真正的價(jià)值所在。