稚暉君人形機器人問世:大模型加持,會自己換胳膊,要上生產線造車(2)
如何讓通用機器人實現(xiàn)低成本量產,產生實際應用價值?稚暉君表示,硬件只是前提條件之一,更重要的其實是背后的機器人大腦。
在當前的具身智能領域,很多研究都在嘗試將大模型作為機器人的大腦,稚暉君也不例外,他也想用多模態(tài)大模型的能力賦能智元機器人的行為動作編排。在智元機器人上個月發(fā)布的一個視頻中,我們已經看到了這個想法的初步實現(xiàn),比如給出自然語言指令「把離你最近的木塊放到紫色的方塊右邊 3 厘米」,機器人就會按照指示行動。
稚暉君把這個機器人背后的大模型叫做 WorkGPT,這是一個百億級參數(shù)的大模型。
在稚暉君看來,語言和圖像大模型對于機器人領域應用最大的價值在于兩個方面,一是龐大的先驗知識庫和強大的通識理解能力,比如你不用告訴它什么是垃圾,它就能自己分辨出來;二是復雜的語義多級推理能力,即所謂的「思維鏈」,這體現(xiàn)在它可以把復雜的指令分成一個一個的步驟。
「在大模型時代到來之前,機器人都是專用設備,我們需要針對性地對每一個任務進行調試和部署?,F(xiàn)在利用大模型的各種通識能力和舉一反三的推理能力,我們可以看到解決這些問題,然后最終走向通用機器人的一道曙光。」稚暉君說。
所以,在智元,他們打造了一個名為 EI-Brain 的具身智腦框架。在框架中,機器人系統(tǒng)被分為不同層級,包括部署在云端的超腦,部署在端側的大腦、小腦以及腦干,分別對應機器人任務不同級別的技能,包括技能級、指令級、伺服級等。具體來說,「大腦」負責跟我們人類一樣進行抽象思考、多級推理,「小腦」負責運動控制方面的一些指令生成,「腦干」負責電機控制、伺服等硬件底層任務。
如果端側模型泛化能力不夠,系統(tǒng)可以去連接云端,實現(xiàn)更復雜的任務調度;另一方面,偏向于硬件底層的電機控制等工作都在本地甚至模塊中完成。
「這類似于自動駕駛上 L1 到 L5 的不同分級 —— 想要構建全場景通用的智能機器人,存在不同的發(fā)展階段,」稚暉君表示?!肝覀兌x了一系列 Meta skill,在語言操作庫范圍限定的有限泛化的場景內,機器人可以實現(xiàn)自主的推理決策,然后完成端到端的任務編排。隨著能力庫不斷擴充,機器人能夠勝任的任務空間也將指數(shù)級增長,最終可以實現(xiàn)全場景的覆蓋,切入千行百業(yè)。這體現(xiàn)了具身智能在交互和學習中進化成長的邏輯。」
為了讓這些層級起作用,智元不止在大模型方面展開了探索,還迭代了其他方面的算法。比如,在運動控制算法方面,他們在幾個月的時間里進行了多次迭代,一直迭代到最近使用的非線性的 NMPC,以及目前正在開發(fā)中的基于各種 learning (比如強化學習)的方法。
同時,他們也在搭建一個用于離線軌跡優(yōu)化的動作庫平臺。
未來,他們還將建立一個開放平臺,為開發(fā)者提供持續(xù)的技術支持、資金獎勵以及合作的機會,而且鼓勵開發(fā)者基于智元的機器人平臺去開發(fā)各種創(chuàng)新的應用功能和解決方案。
未來,這個開放平臺會包含整個機器人的開發(fā)套件,包括 HDK、SDK、基于中間件 AGi ROS 的仿真平臺,以及一些基礎的預訓練大模型等等。同時他們也會去考慮推出一個低成本的教育版的硬件,供大家去進行二次開發(fā)。
未來要賣 20 萬以內
公司成立半年不到就發(fā)布第一款樣機,還具備完整的體系,讓人們不由得感嘆現(xiàn)在 AI 領域創(chuàng)業(yè)公司速度之快。更重要的是,智元機器人并不是一味在追求前沿技術探索,而是「所有產品都在為商業(yè)落地服務」。
發(fā)布會上稚暉君表示,希望能把整機成本控制在 20 萬元以內,使其具備落地的條件,并計劃在遠征 A1 發(fā)布后,以此為基礎馬上推出第一代商用產品。
商業(yè)化也已經有了相對具體的方向:基于當前的人形機器人技術,公司已在與國內新能源頭部車企商討合作。希望在汽車制造總裝線、分裝線等場景上進行商用化落地的嘗試,另外也在和 3C 制造的大廠研究合作。
智元機器人還計劃在未來幾年里把人形機器人推廣到更多領域。在消費級市場,人形機器人預計可適用的方式包含烹飪、家政、家庭護理、康復訓練等。
智元機器人(AGIBOT)成立于 2023 年 2 月,目前融資已經完成了四輪,投資方包括高領、百度等風投機構。說到公司未來的發(fā)展,智元計劃逐步開放開發(fā)平臺,在未來以每年一代的速度迭代新的樣機產品,并不斷進行商用驗證。
稚暉君也表示,為了支持計劃,公司即將開啟秋招。
智元機器人投身的具身智能當前是一個熱門領域。谷歌、斯坦福、英偉達等國際科技機構都在這方面展開了研究,并在近期展示了他們的具身智能機器人成果。今年 3 月份,一家名為 1X 的具身智能機器人公司還拿到了 OpenAI 的投資。隨著稚暉君等國內外優(yōu)秀人才的快速進場,或許我們很快就能看到行業(yè)內出現(xiàn)顛覆性的應用。
「我的夢想是有一天能夠真正造出科幻電影中的智能機器人,它不再是簡單的機械裝置,而是擁有自主思考和學習能力的智能伙伴,能夠感知、理解我們的世界,并與我們深入溝通,」稚暉君說道?!高h征 A1 的發(fā)布,只是我們追求的起點。」
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。