【機床商務網欄目 科技動態】11月21日,小米正式發布具身大模型MiMo-Embodied,并宣布全面開源。
小米介紹,隨著具身智能逐步落地家居場景、自動駕駛技術邁向規模化應用,行業內一個關鍵問題日益凸顯:機器人與車輛如何更好地實現認知與能力互通?室內作業智能與室外駕駛智能能否實現相互促進?
小米具身大模型MiMo-Embodied就是為此而生,這是業界首個成功打通自動駕駛與具身智能的跨域具身基座模型,它實現了兩大領域任務的統一建模,標志著通用具身智能研究從“垂直領域專用”向“跨域能力協同”邁出關鍵一步。
它有三大核心技術亮點:
1.跨域能力覆蓋:同步支持具身智能三大核心任務(可供性推理、任務規劃、空間理解)與自動駕駛三大關鍵任務(環境感知、狀態預測、駕駛規劃),形成全場景智能支撐;
2.雙向協同賦能:驗證了室內交互能力與道路決策能力的知識轉移協同效應,為跨場景智能融合提供了新的思路;
3.全鏈優化可靠:采用“具身/自駕能力學習→CoT推理增強→RL精細強化”多階段訓練策略,有效提升模型在真實環境中的部署可靠性。
在涵蓋感知、決策與規劃的29項核心基準測試(Benchmarks)中,MiMo-Embodied確立了開源基座模型的性能新標桿,全面優于現有的開源、閉源及專用模型:
具身智能領域:在17個Benchmarks上取得SOTA成績,重新定義了任務規劃、可供性預測及空間理解的能力邊界;
自動駕駛領域:在12個Benchmarks上表現卓越,實現了環境感知、狀態預測與駕駛規劃的全鏈路性能突破。
通用視覺語言領域:在夯實通用感知與理解能力的同時,進一步在多項關鍵基準上實現了顯著的性能躍升,展現了卓越的泛化性。



今日焦點
往期回顧




所有評論僅代表網友意見,與本站立場無關。