認真的嗎?讓機器狗當守門員,還發(fā)了篇論文
機器狗不僅能跑能跳,踢足球、當守門員都很行。
讓一個機器狗擔當足球守門員,靠譜嗎?靠不靠譜,我們先看看效果在下結(jié)論。
工作人員一次很溫和的進攻,機器狗攔住了球:
加點難度,來個拋物線進球,也不再話下:
用手拋球有作弊嫌疑?用腳試試,機器狗也能把球門守的死死的
有趣的是,該研究還嘗試讓一只機器狗踢球,另一只當守門員,兩只機器狗自己也能玩挺好:
看完效果,感覺機器狗當守門員還挺靠譜。這款機器狗是 MIT 在 2019 年研發(fā)的 Mini Cheetah,現(xiàn)在來自加州大學伯克利分校等機構(gòu)的研究者為 Mini Cheetah 部署了一個新的強化學習框架,讓它完成足球守門任務,守門成功率高達 87.5%。
論文地址:https://arxiv.org/pdf/2210.04435.pdf
4 米開外踢球
Mini Cheetah 僅用不到 1 秒成功守門
讓 Mini Cheetah 學會守門還是一件比較難的事,因為這涉及物體(例如球)拋出的高度以及動態(tài)移動的位置,具體而言,一方操縱一個快速移動的球,球的方向和位置不確定,而另一方需要迅速判斷球的位置以阻止進球。想要完成這一任務,需要教會機器人動態(tài)移動它的身體,同時確保它的腳 (或臉) 到達它們需要及時阻擋球的地方,這基本上是將兩個難題結(jié)合在一起。
該研究的解決辦法是將運動控制器與末端執(zhí)行器軌跡規(guī)劃相結(jié)合,這樣一來就可以找到最佳的方法讓 Mini Cheetah 在球到達目標不到一秒的時間內(nèi),進行阻擋。
完成上述過程,還需要訓練 Mini Cheetah 掌握一套有用的守門員技能,例如 Mini Cheetah 需要掌握在地面附近和靠近地面的地方對球進行側(cè)身****、掌握俯沖到達球門的下角技術、跳躍到球門的頂部和上角。做完這些動作,Mini Cheetah 都可以恢復并最終安全著陸。每個技能的參考動作都是手動編程的,在模擬中進行訓練,然后直接遷移到機器人上。
Mini Cheetah 防守的球門寬 1.5m,高 0.9m,球(3 號)從約 4m 外踢出,球被外部跟蹤,然后 Mini Cheetah 攔球。讓這么小的機器狗完成攔球動作,其表現(xiàn)是令人印象深刻的。
該研究表明,這款機器狗系統(tǒng)可以將在仿真中學習到的動態(tài)動作和守門員技能遷移到一個真正的四足機器人上,在現(xiàn)實世界中,對隨機射門的守門成功率為 87.5%。而人類足球守門員的平均成功率是 69%。研究人員表示,他們所提出的框架可以擴展到其他場景,例如多技能足球。
下面我們來看看支持這款機器狗的背后框架。
分層強化學習框架
首先,讓四足機器人做足球守門員是一個很有挑戰(zhàn)性的問題,因為它必須要同時解決預測物體運動軌跡和機器人捕獲非抓握物體(球體)兩個實際問題。機器人需要在很短的時間內(nèi)(通常不到一秒)對空中飛行的球做出反應并****。
為了完成這個挑戰(zhàn),研究團隊提出了一個分層無模型強化學習 (RL) 框架。該框架包含一個針對不同運動技能的多個控制策略,覆蓋了目標的不同區(qū)域。
這些控制策略讓機器人能夠跟蹤隨機參數(shù)化末端執(zhí)行器的軌跡,同時執(zhí)行特定的運動技能,例如跳躍攔球、撲球和順勢攔住地面滾動的球。
RL 框架中包含一個高級規(guī)劃器,它幫助機器人確定所需的運動技能和規(guī)劃末端執(zhí)行器軌跡,以****飛向不同目標區(qū)域的球。
該研究在 MIT 2019 年提出的 Mini Cheetah 四足機器人上部署了上述 RL 框架,實驗表明這種 RL 框架能夠讓四足機器人有效****現(xiàn)實世界中快速移動的球。
此前對四足機器人 RL 框架的研究主要集中在低級運動控制上,例如讓機器人按要求速度步行、模仿參考運動。而該研究提出的框架將學習到的運動技能擴展到更高級別的任務上,成功使用高級規(guī)劃讓四足機器人以敏捷的動作精確****快速移動的足球。這對四足機器人的高級規(guī)劃控制具有重要意義。
參考鏈接:https://spectrum.ieee.org/football-robot-mini-cheetah
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。