蕪湖2025年7月29日 /美通社/ -- 近日 AiMOGA墨甲機(jī)器人墨茵(Mornine)在真實(shí)4S店環(huán)境中成功完成"自主開車門"操作,成為業(yè)內(nèi)首個實(shí)現(xiàn)此項(xiàng)復(fù)雜物理交互任務(wù)的具身智能機(jī)器人。這一突破不僅標(biāo)志著具身智能從實(shí)驗(yàn)室走向真實(shí)世界,更為服務(wù)型人形機(jī)器人的商業(yè)化部署奠定了關(guān)鍵技術(shù)基礎(chǔ)。
在機(jī)器人行業(yè)中,看似簡單的"開車門"動作,實(shí)則對機(jī)器人感知、規(guī)劃與控制能力提出了極高要求。墨甲團(tuán)隊(duì)在不斷的工程試錯與算法迭代中,攻克了感知融合、全身控制、上下肢協(xié)同等多個技術(shù)難點(diǎn),最終讓墨茵具備了在非結(jié)構(gòu)化場景中,自主識別車門、調(diào)整站位、協(xié)調(diào)動作、拉開車門的能力。
打破"預(yù)設(shè)指令"邊界,實(shí)現(xiàn)端到端閉環(huán)控制
傳統(tǒng)機(jī)器人執(zhí)行任務(wù)常需依賴分步驟指令或遠(yuǎn)程操控,而墨茵采用端到端閉環(huán)控制架構(gòu),實(shí)現(xiàn)了隱空間層面的"感知-規(guī)劃-執(zhí)行"的流暢融合。以3D激光雷達(dá)、深度相機(jī)、廣角相機(jī)等多模態(tài)傳感器為基礎(chǔ),輔以視覺基礎(chǔ)模型(Visual Foundation Model),構(gòu)建起完整的環(huán)境與自身狀態(tài)感知模型,并借助Chery大模型進(jìn)行語義理解與任務(wù)生成。
當(dāng)面對不同車型門把手或突發(fā)阻力時,墨茵能實(shí)時調(diào)整路徑、姿態(tài)和發(fā)力方式。這種仿佛"本能反應(yīng)(System 1)"的執(zhí)行機(jī)制,使機(jī)器人真正具備了面對動態(tài)環(huán)境的即刻決策與動作調(diào)控能力。
強(qiáng)化學(xué)習(xí)賦能,自主識別"門把手"目標(biāo)
此次"開車門"能力并非靠人工示教,而是通過數(shù)百萬次虛擬訓(xùn)練迭代完成。在訓(xùn)練中,機(jī)器人僅接收到"成功抓住門把手"這一獎勵信號,卻在反復(fù)試驗(yàn)過程中自主聚焦了門把手區(qū)域。
"我們其實(shí)從未明確告訴機(jī)器人‘門把手'是什么,但它最終靠自己學(xué)會了抓住目標(biāo)。"研發(fā)人員表示。這種能力,正是端到端強(qiáng)化學(xué)習(xí)在真實(shí)世界中的落地體現(xiàn)。
上下肢協(xié)同,打造"擬人式"動作鏈條
為應(yīng)對車門阻力與抓握穩(wěn)定性挑戰(zhàn),墨茵采用"flow-based motion(流動式動作機(jī)制)"。在開門過程中,機(jī)器人不僅由手臂發(fā)力,更通過腿部與腰部姿態(tài)調(diào)整形成全身配合,模擬出類似"太極推手"的發(fā)力結(jié)構(gòu)。
項(xiàng)目初期團(tuán)隊(duì)嘗試過僅靠上肢發(fā)力拉門,但機(jī)器人經(jīng)常被車門"拽走"。最終通過強(qiáng)化手部結(jié)構(gòu)、增加腳底防滑、設(shè)定合理姿態(tài)與站位精度要求,并同步優(yōu)化控制模型、增強(qiáng)動作執(zhí)行過程中的數(shù)據(jù)反饋機(jī)制和策略更新能力,逐步實(shí)現(xiàn)穩(wěn)定開門動作。"從失敗無數(shù)次,到第一次拉開車門,那一刻我們知道這事成了。"研發(fā)團(tuán)隊(duì)成員回憶道。
Sim2Real遷移,構(gòu)建從虛擬到現(xiàn)實(shí)的落地閉環(huán)
訓(xùn)練完成后的模型通過Sim2Real技術(shù)平滑遷移至實(shí)體機(jī)器人,使虛擬世界中形成的策略能夠真實(shí)應(yīng)用。部署過程中,機(jī)器人還能收集環(huán)境反饋數(shù)據(jù),回流訓(xùn)練系統(tǒng)用于模型增強(qiáng),形成數(shù)據(jù)閉環(huán)。
這一"預(yù)訓(xùn)練-現(xiàn)實(shí)強(qiáng)化-端到端控制"的完整路徑,被廣泛認(rèn)為是當(dāng)前機(jī)器人行業(yè)中最具通用性與可擴(kuò)展性的技術(shù)范式。
落地4S店,服務(wù)真實(shí)用戶場景
目前,墨茵已在奇瑞多家4S店試點(diǎn)部署,承擔(dān)智能接待、產(chǎn)品講解、遞送物品等工作。"開車門"不僅是技術(shù)突破,更是其作為"智能銷售助理"角色的核心能力。
未來,墨甲將繼續(xù)在汽車場景中深耕數(shù)據(jù)積累,優(yōu)化模型泛化能力。面對不同門把手、環(huán)境光照、開關(guān)阻力等變量,機(jī)器人將不斷進(jìn)化,實(shí)現(xiàn)分鐘級生成新動作策略,極大降低新任務(wù)研發(fā)周期。
"我們今天在4S店打開的是一扇車門,未來希望能讓機(jī)器人走進(jìn)千家萬戶,打開更多場景的‘服務(wù)之門'。"從構(gòu)想到現(xiàn)實(shí),從實(shí)驗(yàn)室到真實(shí)商業(yè)空間,墨甲墨茵以"開車門"為標(biāo)志,完成了具身智能機(jī)器人商業(yè)化的重要跳躍。行業(yè)首例的全自主物理交互,不僅展現(xiàn)了墨甲在多模態(tài)感知、上下肢協(xié)同、端到端控制等方面的深厚積累,更為"人形機(jī)器人+汽車"的融合應(yīng)用開啟了新范式。