人形機(jī)器人,有什么值得期待?
在那個(gè)第一臺(tái)黑白電視機(jī)在美國(guó)初初面世、距離后世著名的“圖靈測(cè)試”問世仍有11年的年代,這樣酷炫的產(chǎn)品自然引起了世界范圍的關(guān)注。一時(shí)間,Elektro風(fēng)頭無兩,上電視、演電影、到各地巡回演出,甚至擁有了自己的機(jī)械狗Sparko。
以當(dāng)下的技術(shù)眼光看,Elektro這些所謂的“技能”其實(shí)更多是噱頭——所謂的“走路”,依靠的是輪子和軌道;與操作員的“對(duì)話”,則是通過預(yù)先設(shè)計(jì)好的特殊音節(jié)代碼實(shí)現(xiàn);而別具特色的“抽煙”,則是靠助手把煙塞進(jìn)它上嘴唇的洞中并點(diǎn)燃。
高調(diào)亮相的背后,卻是,普通的落地。
而這一幕與當(dāng)下人形機(jī)器人們的處境也何其相似:本田的Asimo表演踢足球,波士頓動(dòng)力的Atlas能后空翻,小米的“鐵大”在發(fā)布會(huì)上給雷軍獻(xiàn)花后還學(xué)起了敲架子鼓。人們充滿驚奇地欣賞完舞臺(tái)秀之后,卻在商業(yè)應(yīng)用方向感嘆:就這?
80年過去了,人們對(duì)機(jī)器人的想象早已不是這樣“形”上的模仿,而是期待一款真正能成為勞動(dòng)力替代的全能型產(chǎn)品,并且要經(jīng)濟(jì)實(shí)惠到足以從實(shí)驗(yàn)室走進(jìn)生產(chǎn)線,切實(shí)在某個(gè)應(yīng)用場(chǎng)景中發(fā)揮效用。那在供需天平的另一端,制造機(jī)器人的企業(yè),圍繞"人形"做文章已久,又是否真正努力過實(shí)現(xiàn)機(jī)器代人?
據(jù)此,本文將回顧走在技術(shù)研發(fā)前線的兩款機(jī)器人,Asimo與Atlas的艱難產(chǎn)業(yè)化進(jìn)程,盤點(diǎn)當(dāng)下最火“擎天柱”O(jiān)ptimus的技術(shù)亮點(diǎn),以此展望:人形機(jī)器人,商業(yè)化路在何方?
01還沒有一家人形機(jī)器人公司能實(shí)現(xiàn)商業(yè)化
人形機(jī)器人發(fā)展至今,已經(jīng)見得了總統(tǒng),上得了春晚,當(dāng)?shù)昧四袌F(tuán),功能酷炫上天,但在商業(yè)上還是難以落地。本田Asimo、軟銀Pepper均已經(jīng)停產(chǎn),波士頓動(dòng)力Atlas、特斯拉Optimus也還尚處于實(shí)驗(yàn)室階段。為何產(chǎn)業(yè)化那么難?就拿人們最期待的本田Asimo和波士頓動(dòng)力Atlas來說一說。
“時(shí)代先驅(qū)”本田Asimo ,Born in 2000
從高達(dá)和新世界福音戰(zhàn)士等一系列日本動(dòng)漫可以看出,似乎日本對(duì)于人形機(jī)器人有一種與生俱來的執(zhí)念,而濃厚的機(jī)器人產(chǎn)業(yè)底蘊(yùn)以及良好的經(jīng)濟(jì)基礎(chǔ),也給這個(gè)時(shí)期的日本研發(fā)人形機(jī)器人提供了良好的環(huán)境。
自 1967 年起,日本人就在仿人機(jī)器人領(lǐng)域孤獨(dú)地前行了半個(gè)世紀(jì)。而本田的ASIMO ,被認(rèn)為是致敬著名科幻作家阿西莫夫Asimov,它作為全球最早實(shí)現(xiàn)雙足行走能力的機(jī)器人,代表了日本人形機(jī)器人的最高成就。
持續(xù)半世紀(jì)的孤獨(dú)前行
Asimo前前后后迭代了6個(gè)版本。第一階段1986年至1993年,主要攻克機(jī)器人下肢運(yùn)動(dòng)能力,解決雙足運(yùn)動(dòng)和穩(wěn)定性的難題。第二階段從1993至2000年,逐漸增加了頭、身體和手臂,此時(shí),可以說,一個(gè)完整的Asimo雛形初現(xiàn)。此后第三個(gè)階段,本田似乎想要在Asimo的靈巧手上發(fā)力,機(jī)械手(B25J )的專利數(shù)量在2003-2008年達(dá)到頂峰,占據(jù)了本田機(jī)器人相關(guān)專利近60%。
最新發(fā)布的Asimo單手有 13 個(gè)自由度,雙手自由度幾乎占到全身自由度的一半,通過液壓驅(qū)動(dòng)實(shí)現(xiàn)精細(xì)動(dòng)作,從而能比劃手語,在不捏碎杯子的情況下拿起杯子。本田研發(fā)有限公司資深總工程師兼本田人形機(jī)器人項(xiàng)目負(fù)責(zé)人Satoshi Shigemi說:「很明顯,整體的靈活度是必需的,并因?yàn)槭植窟\(yùn)行能力的提升,它能夠完成更復(fù)雜的任務(wù)。
現(xiàn)實(shí)與夢(mèng)想的差距
雖然酷似阿童木的Asimo一出生就受到世界人民的喜歡,但實(shí)際表現(xiàn)卻不能像動(dòng)畫片里的機(jī)器人戰(zhàn)士一樣滿足人們對(duì)人形機(jī)器人的一切幻想:只能完成“擰開蓋子”“倒水”“踢足球”“跑步”這樣的簡(jiǎn)單功能,會(huì)把高舉手機(jī)照相的動(dòng)作誤認(rèn)為“舉手”,然后一直不停地說“有什么問題要問Asimo?”,充滿電后僅能運(yùn)動(dòng)1小時(shí)。
Asimo更像是一個(gè)宣傳人形機(jī)器人的大使,周游全球,這與本田想要機(jī)器人服務(wù)老年人的初衷背道而馳。除此之外,300-400萬美金的造價(jià),一個(gè)月10萬人民幣的租賃費(fèi)也讓人瞠目咂舌,而目前日本平均護(hù)工的工資也不過1.5萬人民幣/月。本田公司機(jī)器人相關(guān)專利申請(qǐng)時(shí)間分布,數(shù)據(jù)來源:incoPat 專利檢索
雖然Asimo代表了人類一個(gè)時(shí)期最強(qiáng)的人形機(jī)器人,但高昂的成本、并不成熟的供應(yīng)鏈體系、差強(qiáng)人意的表現(xiàn),以及更聚焦細(xì)分功能、場(chǎng)景的掃地/服務(wù)機(jī)器人等商業(yè)進(jìn)展迅速,最終導(dǎo)致Asimo在2018年退出歷史舞臺(tái)。
“地表最強(qiáng)”雙足機(jī)器人Atlas,Born in 2013
Atlas,可謂是“流離失所、坎坷一生”。
1992年,學(xué)術(shù)派創(chuàng)業(yè)者M(jìn)arc Raibert院士從麻省理工將Leg Lab 實(shí)驗(yàn)室(致力于研發(fā)腿式機(jī)器人)剝離出來,成立了波士頓動(dòng)力公司。得益于Leg Lab優(yōu)良的腿部運(yùn)動(dòng)研究基礎(chǔ),波士頓動(dòng)力獲得了美軍的青睞,旗下人形機(jī)器人Atlas的雛形就源自于2009年為美軍測(cè)試防護(hù)服性能的機(jī)器人Petman。
2013年,谷歌母公司Alphabet收購了波士頓動(dòng)力,第一次市場(chǎng)化嘗試卻不如意,一個(gè)想要市場(chǎng),一個(gè)堅(jiān)持理想,沖突不斷升級(jí),終于,谷歌在2015年關(guān)閉了機(jī)器人部門Replicant,并在2017年將波士頓動(dòng)力賣給了軟銀。然而,軟銀在愿景基金帶來的約1.8萬億日元(約171億美元)的投資虧損下,也不得不斷尾求生,于2021年將波士頓動(dòng)力賣給了韓國(guó)現(xiàn)代。
追求極致的運(yùn)動(dòng)能力
為了將運(yùn)動(dòng)能力做到極致,Altas使用了液壓動(dòng)力裝置,依靠流體動(dòng)力可在狹小空間實(shí)現(xiàn)密集解決方案,特別適合大負(fù)載的場(chǎng)合,例如運(yùn)載火箭的發(fā)動(dòng)機(jī)、中國(guó)空間對(duì)接綜合試驗(yàn)臺(tái),還有那滿大街的挖掘機(jī)??蚣芎屯葎t采用3D打印技術(shù),巧妙的將液壓管道內(nèi)置在3D打印鈦金屬骨骼內(nèi),有點(diǎn)模仿人類血管在骨骼內(nèi)那味兒了。
同時(shí),通過頭部的搭載的RGB攝像頭和TOF深度傳感器獲取更加全面的環(huán)境信息,利用自創(chuàng)的“軌跡優(yōu)化行為庫"和模型預(yù)測(cè)控制器(MPC),根據(jù)運(yùn)動(dòng)情況調(diào)整其發(fā)力、姿勢(shì)、動(dòng)作發(fā)生時(shí)機(jī)等細(xì)節(jié)。
除了秀,還能干啥?
在以上如此優(yōu)異的性能下,劣勢(shì)也顯而易見。首先,昂貴。Atlas使用了很多特殊和高成本零部件,一臺(tái)造價(jià)就高達(dá)200萬美金,而同臺(tái)跳舞的的機(jī)器狗spot雖然售價(jià)不到1/20,也僅售出200來臺(tái)。其次,“嬌嫩”,維護(hù)成本高、噪音高、電耗高等。波士頓動(dòng)力也承認(rèn),Atlas機(jī)器人的可靠性還無法與機(jī)器狗spot相比。最后,寂寞,找不到合適的應(yīng)用場(chǎng)景。
Asimo、Atlas,雖然相差十三年,但結(jié)局卻一樣,高昂的成本、缺失的場(chǎng)景,只能淪為行業(yè)先驅(qū)。
02馬斯克的擎天柱,再一次點(diǎn)燃信心
時(shí)間回到2006夏日的一天,馬斯克夢(mèng)到一個(gè)完全自動(dòng)化的未來制造工廠,機(jī)器人高速制造所有東西,這些東西被傳送帶在正確的時(shí)間運(yùn)送到正確的地方。夢(mèng)醒后興奮的馬斯克,宣布特斯拉要用“機(jī)器生產(chǎn)機(jī)器”,也就是建立全自動(dòng)化工廠模式。
接下來便是特斯拉眾所周知的“產(chǎn)能地獄”經(jīng)歷。而自動(dòng)化工廠的失敗,并沒有打消馬斯克對(duì)于全無人工廠的執(zhí)念,反而播下了量產(chǎn)“工人”的種子。他多次在公開場(chǎng)合發(fā)起了牢騷:為什么現(xiàn)在的機(jī)器人,都無法實(shí)現(xiàn)像人手一樣實(shí)現(xiàn)“撿起零件并放置在電池上”這類簡(jiǎn)單的任務(wù)。
因此,當(dāng)人形機(jī)器人Optimus發(fā)布時(shí),馬斯克還特意讓機(jī)器人演示了一遍這個(gè)動(dòng)作,以表成功。但從效果來看,Optimus還是落了個(gè)“高開低走“的狀況,運(yùn)動(dòng)能力嚴(yán)重落后于公眾預(yù)期。不過,它那雙五指靈巧的手,還是值得深究,成為人形機(jī)器人商業(yè)落地的一個(gè)重要突破口。
Optimus的“靈巧手”,圖片來源:特斯拉AI DAY 2022發(fā)布會(huì)預(yù)告
研究一雙靈活的手
人手能以每秒300度的速度移動(dòng),擁有成千上萬的觸覺傳感器和21個(gè)主動(dòng)自由度,是人類勞動(dòng)最完美的工具。而人類對(duì)機(jī)器人多指靈巧手的研究,則是從假肢開始的,作為一個(gè)單獨(dú)學(xué)科,已經(jīng)有64年的研究歷史。
目前主流的靈巧手有兩種方式,一種是內(nèi)置式,即將驅(qū)動(dòng)、傳感、控制等所有的驅(qū)動(dòng)執(zhí)行零部件都集成在手掌內(nèi)。典型代表的靈巧手,是由哈爾濱工業(yè)大學(xué)機(jī)器人研究所 (HIT) 和德國(guó)宇航中心 (DLR) 合作了20多年共同研發(fā)的,而這個(gè)手掌因?yàn)榧闪慵啵彩瞧胀ㄈ耸终频?.5倍大。
另一種,則是外置式。即將體積較大的電機(jī)驅(qū)動(dòng)器外置在手臂,采用拉線方式從遠(yuǎn)端控制靈巧手的關(guān)節(jié)。這種方時(shí)和內(nèi)置相比,成本更低、難度也有所降低。典型代表是英國(guó)的shadow hand,而馬斯克的Optimus也采用這種方式。
一歲嬰兒就會(huì)抓取,但對(duì)于機(jī)器手而言,且不說完全比得上人手,即使可以使用,都走了一段半個(gè)世紀(jì)的研發(fā)路。那么,馬斯克的Optimus,有什么不同呢?
左右滑動(dòng)查看,驅(qū)動(dòng)外置靈巧手代表:英國(guó)shadow hand,圖片來源:Shadow Robot
左右滑動(dòng)查看,典型內(nèi)置式多指靈巧手:DLR-HIT Hand II 靈巧手,圖片來源:Institute of Robotics and Mechatronics
人形機(jī)器人“第一手”
Optimus的設(shè)計(jì)靈感來自于生物學(xué),和人手一樣同樣使用5個(gè)手指,擁有11個(gè)自由度。像拉線玩偶一樣,由5根“經(jīng)脈”(線驅(qū)動(dòng)) 獨(dú)立控制手指的彎曲和展開,負(fù)重20磅(9KG)和自適應(yīng)抓取(能夠抓取不同形狀、尺寸的物體)的能力,因此,使得Optimus的手部勞動(dòng)力能夠勝任工廠的一般工作。
手腕則由兩根執(zhí)行器控制,這個(gè)設(shè)計(jì)不僅能讓手腕轉(zhuǎn)動(dòng),還可以做水平的動(dòng)作,這也是目前市面上其他人形機(jī)器人鮮有見到的。除此之外,特斯拉還需要將4-5kg左右的電驅(qū)手臂集成在雙足機(jī)器人上,這對(duì)人形機(jī)器人的行動(dòng)、操作和精巧抓取都提出了更高要求。
左右滑動(dòng)查看,Optimus靈巧手,圖片來源:特斯拉AI DAY 2022發(fā)布會(huì)
雖然Optimus在技術(shù)領(lǐng)域?qū)崿F(xiàn)了提升,但對(duì)于人形機(jī)器人而言,更重要的話題是:成本,能夠量產(chǎn)降本才是核心。
量產(chǎn)的突破
馬斯克準(zhǔn)備用SpaceX的套路打造機(jī)器人,一切都是以規(guī)模產(chǎn)業(yè)化為目的,以指數(shù)級(jí)砍成本。
一方面大量復(fù)用特斯拉汽車現(xiàn)有技術(shù)降維打擊,包括電池、散熱、視覺避障等。胸腔內(nèi)安置的2.3kWh的電池,能支撐Optimus工作一整天。這個(gè)耗電量,差不多也是一個(gè)成年勞動(dòng)者一天消耗的能量。另一方面全身都沒有使用特殊訂制的零部件,而是優(yōu)化了全身 28 個(gè)驅(qū)動(dòng)器設(shè)計(jì)參數(shù),最終采用通用的兩類六種伺服關(guān)節(jié)(基于無框力矩電機(jī)+諧波減速器的旋轉(zhuǎn)關(guān)節(jié),基于力矩電機(jī)+滾珠絲杠的線性關(guān)節(jié))。而至于Optimus比老人還走的慢,那是因?yàn)樘厮估瓝p失了一定響應(yīng)速度,以降低能耗。
通過這套流程下來,Optimus的吸引力大增:2萬美金一臺(tái)、一周工作7天、充電一次工作一整天。而對(duì)比之下,美國(guó)特斯拉工廠一個(gè)普通工人工資一小時(shí)最少16.2美元,一個(gè)月近6000美元,也就是說,3個(gè)月普通工人的工資,就能買下一臺(tái)一周工作007、不會(huì)請(qǐng)假、不會(huì)抱怨的高效“廉價(jià)勞動(dòng)力”。
而在小批量量產(chǎn)以后,馬斯克還可以將Optimus放在特斯拉超級(jí)工廠里,邊工作邊迭代,也許將來有一天,我們會(huì)看到成千上萬個(gè)Optimus在火星上幫人類搭建家園。
正是因?yàn)橛辛肆慨a(chǎn)的規(guī)劃、手的突破,因此,鋼鐵俠馬斯克,還是給大家?guī)砹撕芏嗥诖?/span>
Optimus的“靈巧手”,圖片來源:特斯拉AI DAY 2022發(fā)布會(huì)
03技術(shù)的演進(jìn)路徑
人形機(jī)器人的發(fā)展還處于突破技術(shù)壁壘的早期階段,導(dǎo)航定位、環(huán)境感知、指令分析、行為控制等關(guān)鍵技術(shù),都還沒完成從“能用”到“好用”的長(zhǎng)征,那么,會(huì)有哪些技術(shù)演進(jìn)路徑呢?
雙足行走,不是移動(dòng)機(jī)器人的唯一選擇
雙足對(duì)于人形機(jī)器人來說承擔(dān)著移動(dòng)的任務(wù)。但相比起來,輪式和四足機(jī)器人應(yīng)用更成熟、成本更小、技術(shù)難度更低。波士頓動(dòng)力曾公開表示,目前Atlas將不會(huì)商業(yè)化,真正實(shí)現(xiàn)商業(yè)化的是它的四足機(jī)器人。這兒大膽猜測(cè)一下,特斯拉的Optimus,是否會(huì)像馬斯克的第一輛電動(dòng)酷炫超跑一樣,目前的雙足只是噱頭,最終產(chǎn)業(yè)化的時(shí)候又會(huì)回到四足或是輪式?
機(jī)械手的靈敏度,反映人形機(jī)器人的技術(shù)實(shí)力
靈巧手的關(guān)節(jié)越多代表越靈活,能做的操作也越多。本田從足部運(yùn)動(dòng)轉(zhuǎn)向機(jī)械手研究,雷軍公開招募靈巧手機(jī)械工程師,也說明了人形機(jī)器人的玩家,開始意識(shí)到手的重要性。
機(jī)器人1.0時(shí)代的代表“機(jī)械臂”模仿人手在制造和組裝流水線,進(jìn)行著無聊的、重復(fù)的、固定的工作;機(jī)器人2.0時(shí)代的代表物流機(jī)器人,通過輪子在提前規(guī)劃好的路徑移動(dòng),利用視覺感知獲取信息并判斷,將物品搬運(yùn)至固定的位置。
這兩個(gè)階段的“手”,也就是末端執(zhí)行器,可以是帶有噴槍、焊槍的工具,也可以是氣動(dòng)吸盤(如波士頓動(dòng)力Handle Logistic機(jī)器人),又或是模仿人手的夾鉗(如小米鐵大)、三指夾爪等。
而機(jī)器人3.0時(shí)代的手,也許會(huì)是布滿了傳感器,通過感知物體的重量、大小、溫度,采取不同的姿勢(shì)和力度對(duì)不同形態(tài)的物體實(shí)施抓取,并使物體表面受力比較均勻,再加上頭部的機(jī)器視覺、算法等技術(shù),最終可以像人一樣進(jìn)行更準(zhǔn)確的判斷。
智能交互,才是我們期待的未來
“手”的操作離不開“腦”的決策,“智能化+類人形+低成本”是機(jī)器人發(fā)展的主要趨勢(shì)。
機(jī)器人研發(fā)一般采用“本體—技能—智能”自下而上的研發(fā)路線,從雙腿運(yùn)動(dòng)逐步擴(kuò)展到手等功能部件,最后考慮智能化。人形機(jī)器人的未來將是,如何讓人形機(jī)器人“更聰明”,面對(duì)復(fù)雜的跨場(chǎng)景工作模式,要真正地實(shí)現(xiàn)代替人,還需提升AI技術(shù)的感知能力。
目前的 AI 應(yīng)用層面仍然過于單點(diǎn)化,只有 AI 能力實(shí)現(xiàn),實(shí)現(xiàn)由單點(diǎn)智能向全局智能、由認(rèn)知智能向決策智能的跨越,我們才能與更聰明的AI 機(jī)器人頻繁互動(dòng)。而通過硬件、算力、算法、數(shù)據(jù)等要素持續(xù)迭代升級(jí),實(shí)現(xiàn)人與機(jī)器人之間達(dá)到人和人之間的交互體驗(yàn),這也是終極人形機(jī)器人商業(yè)化發(fā)展的重要一步。
04結(jié)語
一款真正能成功產(chǎn)業(yè)化的產(chǎn)品,除了技術(shù)的成熟、成本的降低,最重要的還要有足夠廣闊的落地場(chǎng)景:例如二維碼,也是在技術(shù)成熟15年后,才在微信“掃一掃加關(guān)注”這個(gè)場(chǎng)景下,得到了前所未有的應(yīng)用。
而機(jī)器人行業(yè),會(huì)有一道共性難題:標(biāo)準(zhǔn)化生產(chǎn)、和非標(biāo)準(zhǔn)化的應(yīng)用場(chǎng)景。標(biāo)準(zhǔn)化、大規(guī)模生產(chǎn),才有助于降低成本;但要實(shí)現(xiàn)大規(guī)模,場(chǎng)景必然會(huì)擴(kuò)大,于是又會(huì)面臨許多非標(biāo)準(zhǔn)化的需求。這是機(jī)器人不同領(lǐng)域、不同公司都要平衡的要素。
縱觀目前大規(guī)模應(yīng)用的各類機(jī)器人,能快速實(shí)現(xiàn)商業(yè)落地的,大多有幾個(gè)特點(diǎn):功能單一、使用場(chǎng)景固定、需求清晰,比如工業(yè)機(jī)械臂、掃地機(jī)器人等。而人形機(jī)器人既有優(yōu)勢(shì)、又有劣勢(shì),更需要對(duì)矛盾“把玩琢磨”。
一方面,人形機(jī)器人的天然優(yōu)勢(shì)在于其通用性。集成功能多、終極通用裝置,一款成熟的產(chǎn)品即可適用于廣泛的需求場(chǎng)景,不再有傳統(tǒng)“工業(yè)機(jī)器人”、“服務(wù)機(jī)器人”這樣明確的功能屬性。因而,具備標(biāo)準(zhǔn)化、大規(guī)模生產(chǎn)的基礎(chǔ),可以快速降本。
但,另一方面,正是因?yàn)槟睦锒寄苡?,所以,也有可能?huì)顯得,哪里都不是最好用,或者說,有些功能是冗余的。因此,找到場(chǎng)景就很關(guān)鍵。
比較之下,工業(yè)場(chǎng)景也許是人形機(jī)器人邁向產(chǎn)業(yè)化的第一塊陣地。工業(yè)場(chǎng)景,既有需求,可以將人類從繁重、危險(xiǎn)的“4D”工作中解放出來;又具備一定通用性,適配部分工業(yè)場(chǎng)景領(lǐng)域分散、各自規(guī)模較小的問題。同時(shí),在經(jīng)濟(jì)性上,相對(duì)于C端客戶,工業(yè)場(chǎng)景的支付意愿、能力也更高。
人形機(jī)器人,技術(shù)在不斷突破新高,但人類的需求也在不斷豐富、復(fù)雜。這是一場(chǎng)供給和需求的賽跑、技術(shù)和商業(yè)的較量,前后者之間,似乎就像程序員永遠(yuǎn)跟不上產(chǎn)品經(jīng)理的步伐一樣。但幸運(yùn)的是,技術(shù)的發(fā)展,并非線性,奇點(diǎn)之后就會(huì)有極大跨越。
也正因此,在大眾紛紛失望嘆氣之時(shí),人形機(jī)器人領(lǐng)域創(chuàng)業(yè)者和投資人們,依然會(huì)在心里打氣:這是“長(zhǎng)坡厚雪”。
來源:遠(yuǎn)川科技評(píng)論
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。