他曾是本田ASIMO機(jī)器人行走控制團(tuán)隊(duì)唯一中國(guó)研究員,今攜十年研發(fā)經(jīng)驗(yàn)歸國(guó),力爭(zhēng)讓雙足機(jī)器人比肩美日德 | 專訪
日前,之江實(shí)驗(yàn)室 PI 研究員、前本田技研先端中心研究員、大阪大學(xué)博士 & 特聘研究員付春江,這樣形容自己回國(guó)的 “雙足機(jī)器人使命”。
今年 36 歲的付春江生于遼寧鞍山,本科畢業(yè)于華東理工大學(xué)信息學(xué)院及認(rèn)知神經(jīng)動(dòng)力學(xué)研究所,畢業(yè)后東渡日本來(lái)到大阪大學(xué)讀博,主要研究雙足行走控制,期間師從日本生體工學(xué)權(quán)威專家野村泰伸教授。
畢業(yè)后,先在大阪大學(xué)擔(dān)任特聘研究員,后出走象牙塔來(lái)到日本本田公司阿西莫(ASIMO)仿人機(jī)器人,負(fù)責(zé)新型雙足運(yùn)動(dòng)控制研究。
他說(shuō),阿西莫小組雙足控制崗位從未招聘過(guò)中國(guó)人。在波士頓動(dòng)力的機(jī)器狗誕生之前,阿西莫祖機(jī)器人動(dòng)作多樣性一直處于全球領(lǐng)先動(dòng)態(tài),其驅(qū)動(dòng)方式為電機(jī)驅(qū)動(dòng)。
1998 年起,本田公司秘密研發(fā)十年,曾誕生過(guò)全球首臺(tái)獨(dú)立行走和獨(dú)立奔跑的雙足機(jī)器人,一度曾引起轟動(dòng)。
加入該公司后,付春江在新型控制器方面做了較多貢獻(xiàn)。其中,高維不穩(wěn)定動(dòng)力學(xué)流形是他的代表性工作之一。
從全身高維動(dòng)力學(xué)模型出發(fā),推導(dǎo)出全身高維動(dòng)力學(xué)的非穩(wěn)定流形
傳統(tǒng)的雙足控制基于模板動(dòng)力學(xué),即雙足機(jī)器人會(huì)涉及到一個(gè)特別高維的非線性動(dòng)力學(xué)過(guò)程。
此前,相關(guān)研究人員一般先把它進(jìn)行降維,用一個(gè)線性倒立擺或者一個(gè)彈性倒立擺,先對(duì)整體高維動(dòng)力學(xué)進(jìn)行近似,接著先處理比較簡(jiǎn)單的模型,然后再使用映射方法映射到全身運(yùn)動(dòng)型模型或動(dòng)力學(xué)模型。
在讀博期間的第一篇論文,付春江繞開(kāi)從模板動(dòng)力學(xué)模型出發(fā)的方法,而是從全身高維動(dòng)力學(xué)模型出發(fā),然后推導(dǎo)出全身高維動(dòng)力學(xué)的非穩(wěn)定流形。
此前,使用低維非穩(wěn)定流形或捕獲點(diǎn)方法非常流行,但之前在高維非穩(wěn)定流形方面并沒(méi)有人做。
因此,付春江是首個(gè)提出高維不穩(wěn)定動(dòng)力學(xué)流形的學(xué)者,通過(guò)考察單足支撐和雙足支撐相的可控性,提出在雙足支撐項(xiàng)施加間歇控制,對(duì)雙足支撐時(shí)的非穩(wěn)定流形施加控制從而實(shí)現(xiàn)穩(wěn)定行走。
因?yàn)橹粚?duì)非穩(wěn)定流形的部分加以控制,并只在一小段窗口期施加,可大大減少控制能耗,對(duì)于穩(wěn)定流形部分則采用放任方式,這樣雙足行走會(huì)更自然。
更快的實(shí)時(shí)計(jì)算速度,更少的能量消耗
付春江在本田的很多工作,有些以論文形式發(fā)表,有些則申請(qǐng)為專利。
其中有一個(gè)專利涉及到機(jī)器人雙足控制方式,他告訴 DeepTech,一種流行的控制機(jī)器人雙足的方式叫混合零動(dòng)力方式,該方法由美國(guó)密歇根大學(xué) Jessy Grizzle 教授于 20 世紀(jì) 90 年代提出。
在研究早期,付春江相對(duì)獨(dú)立地提出了一套類似的方法,該方法也是從全身動(dòng)力學(xué)出發(fā),基于任務(wù)空間而非關(guān)節(jié)空間,可實(shí)現(xiàn)輕松規(guī)劃腳步經(jīng)過(guò)的弧線、身體倒立擺經(jīng)過(guò)的長(zhǎng)度、以及支撐腿部到身體重心的長(zhǎng)度。
經(jīng)過(guò)反饋線性化的方法,再用微分幾何的方式,可把全身動(dòng)力學(xué)映射到模型任務(wù)空間,變成在任務(wù)空間當(dāng)中的全身動(dòng)力學(xué)方式。
然后在任務(wù)空間中再利用它的規(guī)劃,就可方便地達(dá)成各種各樣的行走方式。比如,機(jī)器人可實(shí)現(xiàn)在上下坡、臺(tái)階等非平整地面上行走。
這套方法的優(yōu)點(diǎn)在于,其一可在線進(jìn)行計(jì)算,只要前期把微分幾何當(dāng)中的各階李導(dǎo)數(shù)全部計(jì)算好,那么實(shí)時(shí)計(jì)算速度就會(huì)很快,因此非常適合機(jī)器人;其二由于是全身動(dòng)力學(xué)規(guī)劃,非必要的能量消耗會(huì)更少。
但是,對(duì)于初值和干擾來(lái)說(shuō),反饋線性化的方式比較缺乏魯棒性。
為應(yīng)對(duì)該問(wèn)題,付春江聯(lián)合斯坦福大學(xué)團(tuán)隊(duì),開(kāi)發(fā)出基于采樣的直接策略優(yōu)化法。
其本質(zhì)在于原來(lái)做優(yōu)化的時(shí)候,優(yōu)化軌跡是一條線,但受干擾的這條線會(huì)偏離原來(lái)的軌道,這樣系統(tǒng)就不具備魯棒性。
研究中,他們提出在某一個(gè)狀態(tài)點(diǎn)周圍進(jìn)行采樣,借鑒無(wú)色卡爾曼濾波器的思想,來(lái)對(duì)采樣點(diǎn)進(jìn)行地推。
這樣就能實(shí)現(xiàn)在保留非線性的同時(shí),不對(duì)系統(tǒng)的動(dòng)力學(xué)特性進(jìn)行改變,那么最終優(yōu)化出來(lái)的是一條管道,而不再限于一條線。
在優(yōu)化出來(lái)的這條管道之內(nèi),只要系統(tǒng)狀態(tài)量在管道之內(nèi),就能保證整個(gè)系統(tǒng)的魯棒性。
說(shuō)到這里付春江舉例稱,火箭里面的燃料會(huì)產(chǎn)生一定的波動(dòng)或震動(dòng),因此火箭整體質(zhì)量分布就會(huì)發(fā)生抖動(dòng)或變化,這等于只有火箭下部有推動(dòng)力,這時(shí)對(duì)其做控制就會(huì)比較難。
因此他提出這樣一種優(yōu)化管道的方法,來(lái)保證對(duì)內(nèi)部擾動(dòng)、外部空氣擾動(dòng)都具有魯棒性,因此火箭可以安全順利地著地。
在他的研究中,另一個(gè)困難是如何找出在任務(wù)空間的參考軌跡,方法是基于帶接觸的模型預(yù)測(cè)控制。
波士頓動(dòng)力等公司使用的是為基于線性互補(bǔ)條件(LCP)的方法。但是,他們提出了更好的方法,即把 LCP 接觸,看做是一層優(yōu)化,然后把利用模型預(yù)測(cè)控制 MPC 作為上層的優(yōu)化,接著基于這兩層優(yōu)化去解決相應(yīng)問(wèn)題并能達(dá)到準(zhǔn)實(shí)時(shí)的計(jì)算速度。
開(kāi)發(fā)可改變阻抗的驅(qū)動(dòng)器
在工業(yè)機(jī)械臂中有位置控制、力矩控制和阻抗控制三種方式,但是在雙足機(jī)器人上,目前做出來(lái)的只有位置控制和力矩控制的雙足機(jī)器人。
這是因?yàn)殡p足機(jī)器人存在本質(zhì)不穩(wěn)定的問(wèn)題,控制起來(lái)也更難。但是與環(huán)境和人相接觸、改變動(dòng)作吸引子狀態(tài),以及節(jié)約能量注入能量等,都需要阻抗控制,因此改變阻抗十分重要,且會(huì)帶來(lái)新的應(yīng)用場(chǎng)景。
基于此,付春江與團(tuán)隊(duì)開(kāi)發(fā)了可以改變阻抗的驅(qū)動(dòng)器,采取的方式是改變力臂長(zhǎng)度,然后對(duì)變阻抗驅(qū)動(dòng)器進(jìn)行建模,研制和測(cè)試。
據(jù)他介紹,以前的變阻抗驅(qū)動(dòng)器主要用于上肢,輸出力矩較小,這款變阻抗驅(qū)動(dòng)器的輸出力矩目前是世界最大的,可在 0.1 秒之內(nèi)改變阻抗。未來(lái)有望用在雙足機(jī)器人中的腿足。
相比輪式機(jī)器人,雙足機(jī)器人的優(yōu)勢(shì)在于可探索不連續(xù)平整的地面比如爬上陡坡,而輪式機(jī)器人則很難通過(guò)超過(guò) 60 度的坡度。
而雙足機(jī)器人的占地非常小,因此落腳點(diǎn)也非常小,因此能通過(guò)支持反作用力來(lái)維持動(dòng)態(tài)平衡。
另外相比四足機(jī)器人,雙足機(jī)器人有較高的重心優(yōu)勢(shì),因此能解放雙手來(lái)做一些高重性的動(dòng)作。比如去開(kāi)一扇門(mén)以及端一盤(pán)菜。而波士頓動(dòng)力狗等四足機(jī)器人則很難做這樣的動(dòng)作,因?yàn)樗闹匦谋容^低。
此外,雙足機(jī)器人可利用全身的動(dòng)作,以投擲的方式來(lái)讓雙手集中全身力量,即便它的驅(qū)動(dòng)器沒(méi)有這么大的力量,但是它的輸出比一個(gè)單純的機(jī)械手臂會(huì)有更大的力量輸出。而且,相比于人假如它的零件壞掉,還可進(jìn)行更換。
雙足機(jī)器人的五大潛在實(shí)際應(yīng)用
付春江告訴 DeepTech,結(jié)合相關(guān)優(yōu)勢(shì)和特點(diǎn),雙足機(jī)器人大概有以下五個(gè)落地場(chǎng)景:
第一,用于農(nóng)業(yè)作業(yè)。一般農(nóng)業(yè)工作都是在非鋪裝路面進(jìn)行,這對(duì)于雙足機(jī)器人的腳部支撐面非常小,即只能站在兩行稻田的中間,而這恰好符合雙足優(yōu)勢(shì)。因此其落地場(chǎng)景之一是農(nóng)業(yè),人口城市化的推進(jìn)必將帶來(lái)農(nóng)業(yè)人口的減少,因此可讓它們來(lái)干農(nóng)活。
第二,用于建筑作業(yè)等高重心勞動(dòng)。建筑是一個(gè)高危行業(yè),并且需要高重心勞動(dòng),如果使用雙足機(jī)器人,其不僅能幫助人類避免可能的危險(xiǎn),且具備高重心作業(yè)能力。
第三,用于照顧老人。老齡化社會(huì)會(huì)催生更多家庭服務(wù)需求,全球很多國(guó)家的年輕人都會(huì)到大城市發(fā)展,很多老齡化人口并不能得到子女長(zhǎng)期穩(wěn)定的陪護(hù)。而雙足機(jī)器人可起到照顧老年勞動(dòng)力的問(wèn)題,比如給家里買(mǎi)菜、陪老人去散步。此外,還可通過(guò) 5G 和 VR 等連接方式,讓老人以非常快的通訊速度連接到自己的專屬機(jī)器人上,從而享受被照顧的服務(wù)。
第四,用于科考探索。假如需要在地外行星上的非鋪裝路面作業(yè),雙足機(jī)器人不需要像人類宇航員那樣,付出維持生命系統(tǒng)的高昂代價(jià)。
第五,用于災(zāi)害救援和響應(yīng)。災(zāi)害救援場(chǎng)景一般是為了救人,美國(guó)曾舉辦過(guò) DRC 競(jìng)賽,就是這個(gè)場(chǎng)景。
出國(guó)十年,一朝返華
2021 年 3 月,出國(guó)十多年的付春江,正式回國(guó)入職浙江杭州之江實(shí)驗(yàn)室,目前正在籌建雙足機(jī)器人本體項(xiàng)目組。
他們主要研究雙足機(jī)器人的新型結(jié)構(gòu)和控制,希望借此打造一個(gè)適合多場(chǎng)景落地的雙足機(jī)器人。
從事雙足機(jī)器人研究工作多年的他,非常熟悉各種雙足控制流派,比如基于模板動(dòng)力學(xué)的、基于非線性控制的、基于優(yōu)化的,以及基于強(qiáng)化學(xué)習(xí)的,和世界很多高校和公司都有交流或合作。此次回國(guó)也是希望能打造出具有中國(guó)特色的雙足機(jī)器人。
他說(shuō),當(dāng)初出國(guó)時(shí)日本的博士生拿的工資可能都比國(guó)內(nèi)的正式員工待遇要好,但是現(xiàn)在中國(guó)經(jīng)濟(jì)的發(fā)展給科研提供了強(qiáng)勁動(dòng)力,而且在國(guó)內(nèi)也更方便進(jìn)行大團(tuán)隊(duì)的創(chuàng)造性工作,因此他很看好中國(guó)目前乃至后續(xù)的發(fā)展前景。
-End-
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。