博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 獨(dú)家 | 忘記波士頓動(dòng)力公司。這個(gè)機(jī)器人可以自學(xué)走路

獨(dú)家 | 忘記波士頓動(dòng)力公司。這個(gè)機(jī)器人可以自學(xué)走路

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2021-04-29 來(lái)源:工程師 發(fā)布文章

作者:Will Douglas Heavenarchive page

翻譯:陳超

校對(duì):車(chē)前子

本文介紹了波士頓動(dòng)力公司發(fā)布的機(jī)器人Cassie如何實(shí)現(xiàn)自學(xué)走路的虛擬視頻,以及該方法在現(xiàn)實(shí)生活中的困難及應(yīng)用。

波士頓動(dòng)力公司發(fā)布的虛擬視頻讓人印象深刻但是教機(jī)器人自己走路卻有點(diǎn)兒難。

1.jpg混合機(jī)器人

一雙叫做Cassie的機(jī)器腿已經(jīng)通過(guò)強(qiáng)化學(xué)習(xí)的方法被教會(huì)了走路,強(qiáng)化學(xué)習(xí)是一種通過(guò)試錯(cuò)來(lái)教AI復(fù)雜行為的訓(xùn)練技術(shù)。兩條腿的機(jī)器人從零開(kāi)始學(xué)會(huì)了一系列運(yùn)動(dòng),包括蹲著行走以及攜帶意料之外的負(fù)重時(shí)行走。

視頻****:https://youtu.be/goxCjGPQH7U

2.png

但是機(jī)器人可以隨音樂(lè)跳舞嗎?由于波士頓動(dòng)力公司(Boston Dynamics)發(fā)布的熱門(mén)視頻,人們對(duì)機(jī)器人可以做什么的期待越來(lái)越高,視頻展示了人形機(jī)器人Atlas單腿站立,跳過(guò)盒子,并且跳舞。這些視頻累計(jì)達(dá)到了上百萬(wàn)的瀏覽量,甚至也有很多模仿視頻。Atlas對(duì)運(yùn)動(dòng)的控制讓人印象深刻,但是編舞的序列可能涉及到大量手動(dòng)調(diào)參。(波士頓動(dòng)力公司并未披露細(xì)節(jié),所以很難說(shuō)清楚手動(dòng)調(diào)參的量級(jí))。

“這些視頻可能會(huì)讓一些人相信這是一個(gè)已經(jīng)解決了的、很簡(jiǎn)單的問(wèn)題”,加州大學(xué)伯克利分校的Zhongyu Li這樣說(shuō)道,Zhongyu Li與同事們是Cassie的研發(fā)者?!暗窍雽?shí)現(xiàn)機(jī)器人可靠地操作并在人類(lèi)環(huán)境中生活,我們?nèi)匀挥泻荛L(zhǎng)的路要走?!盋assie現(xiàn)在還不能跳舞,但是教這個(gè)真人大小的機(jī)器人自己學(xué)習(xí)走路,這已經(jīng)讓它更接近于能夠處理大部分地形,并在絆倒或受損時(shí)恢復(fù)。

虛擬的局限性:強(qiáng)化學(xué)習(xí)已經(jīng)被用于訓(xùn)練機(jī)器人在虛擬環(huán)境中走路,但是將該能力移植到現(xiàn)實(shí)世界是很困難的。“你看到的許多虛擬代理的視頻根本不是真實(shí)的,”Chelsea Finn說(shuō)道,他是斯坦福大學(xué)的AI和機(jī)器人研究專(zhuān)家,但他并沒(méi)有加入這項(xiàng)工作。虛擬環(huán)境中模擬的物理定律和現(xiàn)實(shí)生活中的物理定律有細(xì)微的差異——例如機(jī)器人的腳和地面的摩擦——可能會(huì)導(dǎo)致機(jī)器人無(wú)法應(yīng)用它所學(xué)到的內(nèi)容。對(duì)一個(gè)重量大的兩腿機(jī)器人來(lái)說(shuō),即使它的移動(dòng)只有小小的一步,都可能失去平衡并且跌倒。

雙重模擬:但是通過(guò)在現(xiàn)實(shí)世界試錯(cuò)的方法來(lái)訓(xùn)練一個(gè)大型機(jī)器人可能是很危險(xiǎn)的事。為了解決這些問(wèn)題,伯克利團(tuán)隊(duì)使用了兩層的虛擬環(huán)境。首先,虛擬版本的Cassie通過(guò)在一個(gè)大的現(xiàn)存機(jī)器人運(yùn)動(dòng)數(shù)據(jù)庫(kù)畫(huà)出軌跡來(lái)學(xué)習(xí)走路。這種模擬之后會(huì)被移植到第二層叫做SimMechanics虛擬環(huán)境,這個(gè)環(huán)境高度準(zhǔn)確地復(fù)刻了現(xiàn)實(shí)世界的物理規(guī)律——以運(yùn)行速度為代價(jià)。只有Cassie走得比較好的時(shí)候,機(jī)器人習(xí)得的步行模型才會(huì)加載到真實(shí)的機(jī)器人當(dāng)中。

真實(shí)的Cassie能夠使用在仿真過(guò)程中習(xí)得的模型走路,不需要額外調(diào)整。它可以通過(guò)粗糙和光滑的區(qū)域,攜帶意外的負(fù)重,并且在被推之后自我恢復(fù)過(guò)來(lái)。在測(cè)試階段,Cassie也會(huì)損壞它右腿位置的兩個(gè)發(fā)動(dòng)機(jī),但是它能夠調(diào)整自己的運(yùn)動(dòng)來(lái)進(jìn)行補(bǔ)償。Finn認(rèn)為這是令人激動(dòng)的工作。帝國(guó)理工學(xué)院機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室的負(fù)責(zé)人Edward Johns也同意這種觀點(diǎn),他說(shuō):“這是我見(jiàn)過(guò)的最成功的案例了,”

伯克利團(tuán)隊(duì)希望使用他們的方法來(lái)增加Cassie的運(yùn)動(dòng)技能。但是并不期待很快它就能學(xué)會(huì)跳舞。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉