文 | 劉士武
編輯 | 楊林
36氪獲悉,3月5日,具身智能與人形機(jī)器人公司「星動(dòng)紀(jì)元」聯(lián)合清華大學(xué)、上海期智研究院開源了人形機(jī)器人強(qiáng)化學(xué)習(xí)訓(xùn)練框架Humanoid-Gym。此舉旨在降低人形機(jī)器人算法的開發(fā)門檻,為全球?qū)W術(shù)界和業(yè)界研究者們?cè)谌诵螜C(jī)器人領(lǐng)域的創(chuàng)新工作提供支持。
星動(dòng)紀(jì)元此前已在人形機(jī)器人強(qiáng)化學(xué)習(xí)技術(shù)上取得多項(xiàng)突破,并通過(guò)端到端強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)了人形機(jī)器人在野外雪地行走和上下樓梯等動(dòng)作。鑒于人形機(jī)器人結(jié)構(gòu)的復(fù)雜性,其強(qiáng)化學(xué)習(xí)訓(xùn)練和從模擬環(huán)境向真實(shí)世界的轉(zhuǎn)移過(guò)程相較于四足機(jī)器人更具挑戰(zhàn)性。
Humanoid-Gym框架通過(guò)設(shè)計(jì)精良的獎(jiǎng)勵(lì)函數(shù)和域隨機(jī)化技術(shù),顯著簡(jiǎn)化了人形機(jī)器人的訓(xùn)練和實(shí)現(xiàn)模擬環(huán)境向真實(shí)世界轉(zhuǎn)換的難度。目前,該框架已在星動(dòng)紀(jì)元旗下的兩款機(jī)器人——小星(1.2米高)和小星Max(1.65米高)上成功驗(yàn)證。
圖片來(lái)源:星動(dòng)紀(jì)元
除了sim-to-real驗(yàn)證外,用戶還可以通過(guò)該框架輕松使用sim-to-sim轉(zhuǎn)換功能,在更高精度的仿真環(huán)境Mujoco中進(jìn)行初步驗(yàn)證與篩選,從而提升轉(zhuǎn)換效率和成功率。
此外開源項(xiàng)目還引入了多項(xiàng)評(píng)估指標(biāo),用以衡量訓(xùn)練策略的效果,包括速度追蹤、動(dòng)作絲滑程度等。
圖片來(lái)源:星動(dòng)紀(jì)元
Humanoid-Gym訓(xùn)練框架的開源標(biāo)志著星動(dòng)紀(jì)元在人形機(jī)器人技術(shù)推廣和共享方面的積極姿態(tài)。通過(guò)降低技術(shù)門檻,星動(dòng)紀(jì)元期望激發(fā)更多的創(chuàng)新思維和解決方案,共同推進(jìn)人形機(jī)器人技術(shù)的未來(lái)發(fā)展。
36氪此前曾報(bào)道,星動(dòng)紀(jì)元于2023年8月在北京成立,由清華大學(xué)交叉信息研究院孵化,致力于具身智能和人形通用機(jī)器人技術(shù)的研發(fā)。2024年1月,星動(dòng)紀(jì)元完成超億元天使輪融資,由聯(lián)想創(chuàng)投領(lǐng)投。公司其旗下有兩款型號(hào)的人形機(jī)器人產(chǎn)品:小星和小星Max,適配不同應(yīng)用場(chǎng)景的需求。