国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

行業新突破:行為基礎模型可實現高效的人形機器人全身控制

人工智能 新聞
來自香港理工大學、逐際動力、東方理工大學、香港大學和 EPFL 等知名機構的研究者合作完成題為 《A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots》 的長文綜述,首次聚焦行為基礎模型在人形機器人全身控制中的應用。

人形機器人作為用于復雜運動控制、人機交互和通用物理智能的多功能平臺,正受到前所未有的關注。然而,由于其復雜的動力學、欠驅動和多樣化的任務需求,實現高效的人形機器人全身控制 (Whole-Body Control,WBC) 仍然是一項根本性的挑戰。

雖然基于強化學習等方法的控制器在特定任務中展現出優越的性能,但它們往往只具有有限的泛化性能,在面向新場景時需要進行復雜且成本高昂的再訓練。為了突破這些限制,行為基礎模型(Behavior Foundation Model,BFM)應運而生,它利用大規模預訓練來學習可重用的原始技能和廣泛的行為先驗,從而能夠零樣本或快速適應各種下游任務。 

來自香港理工大學、逐際動力、東方理工大學、香港大學和 EPFL 等知名機構的研究者合作完成題為 《A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots》 的長文綜述,首次聚焦行為基礎模型在人形機器人全身控制中的應用。

該綜述系統性地梳理了當前 BFM 的最新進展,從預訓練(Pre-training)和任務適配(Adaptation)兩個角度對當前各類 BFM 算法提供了全面的分類體系,并且結合其他基礎模型(例如大語言模型、大規模視覺模型)的發展動向對 BFM 的未來趨勢和研究機遇進行了展望,有望對該領域的研究者和從業者產生引導作用。

圖片

論文標題:

《A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots》

論文鏈接:https://arxiv.org/pdf/2506.20487

項目主頁:

https://github.com/yuanmingqi/awesome-bfm-papers

人型全身控制:從 「定制化」 到 「通用化」

文章將人形全身控制算法的演化總結為下圖中的三個階段:

圖片

基于模型的控制器(Model-based Controller):

以 MPC、WBOSC 等算法為代表,面向基礎的人形全身控制任務,極度依賴物理模型并且需要復雜的人工設計與調校,且魯棒性較低。

基于學習的,面向特定任務的控制器(Learning-based and Task-specific Controller):

以強化學習、模仿學習等方法為代表,面向特定的、復雜的人形全身控制任務,支持靈活的任務設計,但跨任務的泛化性較差。

行為基礎模型(Behavior Foundation Model):

在大規模人類行為數據集上進行預訓練得到的模型,習得大量可復用的基礎技能以及廣泛的行為先驗,具備快速適應不同任務的能力。

什么是行為基礎模型?

「行為基礎模型」 這一術語首次出現在《Fast Imitation via Behavior Foundation Models》 一文中,作者基于無監督強化學習 + 前后向表征學習(Forward-backward Representation Learning)方法構建 BFM,實現了對多種模仿學習規則的支持,包括行為克隆(Behavioral Cloning)、特征匹配(feature matching)、基于獎勵 / 目標的歸納(reward/goal-based reductions)。

該工作也被 ICLR2024 接收為 Spotlight 文章。后續的其他工作則將 BFM 定義為:「對于一個給定的馬爾科夫過程,行為基礎模型是一類以無監督強化學習方法訓練得到的智能體。在測試時,可以為指定的大量獎勵函數生成近似最優的策略,而無需額外的學習或規劃」。

圖片

該綜述將 BFM 的定義拓展為:「一類特殊的基礎模型,旨在控制智能體在動態環境中的行為。BFM 植根于通用基礎模型(例如 GPT-4、CLIP 和 SAM)的原理,使用大規模行為數據(例如軌跡、人類演示或智能體與環境的交互)進行預訓練,從而對廣泛的行為模式進行編碼,而非局限于單任務場景。這一特性確保了模型能夠輕松地對不同任務、情境或環境進行泛化,展現出靈活且自適應的行為生成能力。」

主要算法分類

文章將當前構建 BFM 的方法分為三類:目標導向的學習方法(Goal-conditioned Learning)、內在獎勵驅動的學習方法(Intrinsic Reward-driven Learning),以及前后向表征學習方法(Forward-backward Representation learning)。

圖片

如下圖所示,目標導向的學習方法會對智能體給予明確的任務指導,通常直接將目標輸入到智能體的策略中。目標可以以多種形式指定,例如目標狀態、目標函數或外部任務描述。

圖片

在目標學習的各類方法中,以 DeepMimic 為代表的基于動作追蹤(Motion Tracking)的學習方法目前被廣泛地應用于各類人型機器人任務中。在每個時間步,智能體通常被訓練來跟蹤給定參考運動的關節角度或下一時間步的運動學姿態。相較于直接模仿整個運動(尤其是復雜運動),學習跟蹤單個姿態更容易實現且更具通用性,這也是基于跟蹤的學習的主要動機。

圖片

MaskedMimic 是典型的基于目標學習方法構建的行為基礎模型,其包含兩個階段的訓練過程。首先,MaskedMimic 基于動作追蹤方法對大量的行為數據進行模仿,學習各類基礎運動技能。然后,將得到的底層控制器固定,并訓練一個帶掩碼的變分自編碼器對底層控制器包含的知識進行蒸餾得到高階策略。MaskedMimic 支持多種控制模態,并能在不同任務之間實現無縫切換。

圖片

在基于追蹤的學習中,智能體始終被賦予了明確的目標,并通過顯示指定的獎勵函數進行訓練,以實現定向的技能學習。相比之下,內在獎勵驅動的學習則使用完全不同的方法,即激勵智能體對環境進行探索,而不依賴于明確的特定任務獎勵。智能體受內在獎勵的引導,這些內在獎勵是自我生成的信號,用于鼓勵探索、技能習得或者發現新奇的事物。

但是,只通過內在獎勵訓練 BFM 存在顯著的限制,智能體通常需要進行巨量的訓練才能實現廣泛的行為覆蓋,同時有概率產生不可靠的行為先驗(例如,不安全或不切實際的運動),特別是對于具有極其復雜動力學的人形機器人而言。

因此,在實際應用時,內在獎勵往往要結合其他方法使用,例如目標導向學習,以確保學得模型的有效性。

近期 BFM 的主要進步受益于一種新的學習框架 —— 前后向表征學習,其主要思想是將策略學習與特定任務目標進行解耦。前后向表征學習的核心是對后繼測度(Successor Measure)進行學習,對于一個策略 π,其后繼測度定義為:

圖片

其代表了對未來訪問狀態分布的建模。基于后繼測度,動作價值函數可以表示為:

圖片

以上公式將動作價值函數分解為兩部分:后繼測度和獎勵函數。因此,只要學習到了策略 π 的后繼測度,即可對任意獎勵函數對應的動作價值函數進行零樣本估計,而無需進一步的訓練。在具體學習時,后繼測度又被分解為:

圖片

如下圖所示,我們分別使用一個前向嵌入網絡和一個后向嵌入網絡進行訓練。

圖片

最終,我們可以將策略表示為: 

圖片

Meta 基于前后向表征學習方法開發了 Motivo 模型。如下圖所示,Motivo 學習了廣泛的行為先驗,并展現出卓越的零樣本自適應能力,可應對各種下游任務,包括復雜的運動模仿、姿勢達成和復合獎勵優化。并且,Motivo 能夠在確保運動自然性的同時實現實時運動控制。

圖片

潛在應用與現實限制

文章進一步對 BFM 的潛在應用和現實限制進行了分析,如下圖所示:

圖片

應用方面:

  • 人形機器人的通用加速器:BFM 包含了大量可復用的基礎技能和廣泛的行為先驗,可以消除白板訓練,實現對下游任務的快速適應。諸如 Motivo 等高級 BFM 能直接將高級任務映射為控制動作,大幅縮短開發周期。
  • 虛擬智能體與游戲開發:BFM 能生成逼真、情境感知的 NPC 行為,結合 LLMs 實現復雜指令解析,為游戲提供前所未有的交互真實感。
  • 工業 5.0:BFMs 使人形機器人融合預訓練技能與實時適應性,支持多任務切換和直觀人機協作,推動以人為中心的彈性制造。
  • 醫療與輔助機器人:BFMs 幫助機器人在非結構化環境中適應多樣化需求,如個性化康復訓練和日常輔助任務,應對人口老齡化挑戰。

限制方面:

  • Sim2Real 困難:BFM 在學習豐富行為技能的同時,也加劇了仿真與現實的差異,如動力學不匹配和感知域偏移,目前的實際應用仍主要局限于仿真環境,真實部署面臨行為泛化不穩定等挑戰。
  • 數據瓶頸:BFMs 訓練數據規模遠小于 LLMs 或視覺模型,且機器人真實數據稀缺,多模態數據(如視覺 - 本體感知 - 觸覺對齊)尤其缺乏,亟需更大規模、高質量數據集支撐發展。
  • 具身泛化:當前 BFMs 僅針對特定機器人形態訓練,難以適應不同構型(如關節類型、驅動方式或傳感器配置),需開發更具通用性的架構以實現跨平臺技能遷移。

未來研究機會與伴隨風險

最后,文章探索了未來的研究機會和伴隨的風險:

圖片

研究機會方面:

  • 多模態 BFM:未來 BFM 需整合視覺、觸覺等多模態感知輸入,以增強非結構化環境中的適應能力,但面臨數據集和訓練范式的挑戰。
  • 高級機器學習系統:BFM 可與 LLM 等結合,形成認知 - 運動一體化架構,由 LLM 負責任務規劃,BFM 執行實時控制,實現復雜任務的靈活處理。
  • 縮放定律:BFM 的性能可能隨模型規模、數據量和計算資源提升而增強,但需平衡行為多樣性與控制效率,其中數據質量對行為先驗的學習尤為關鍵。
  • 后訓練優化:借鑒 LLM 中的的微調、RL 對齊和測試時優化技術,可提升 BFM 的行為對齊性和實時計算效率,需開發針對機器人控制的專用方法。
  • 多智能體系統:BFM 能免除單機器人基礎技能訓練,直接支持多機協作研究,但需開發基于群體交互數據的新型模型以解決物理協調難題。
  • 評估機制:當前缺乏 BFM 的標準化評估體系,未來需構建涵蓋任務泛化性、魯棒性和人機安全的多維度基準,推動通用物理控制器發展。

風險方面:

  • 倫理問題

訓練數據的局限性可能導致機器人行為編碼人口偏見或泄露用戶健康隱私,而其實體化部署可能放大有害動作的社會風險,亟需建立覆蓋數據規范和實時行為治理的新框架。

  • 安全機制:

BFM 面臨傳感器干擾引發的控制失效和多模態攻擊漏洞等風險,需通過對抗訓練和跨模態校驗等機制確保其在開放環境中的可靠性和安全性。這些挑戰要求研究者在技術創新的同時,同步推進倫理規范和安全防護體系的建設。

結語

該綜述首次系統性地梳理了行為基礎模型在人形機器人全身控制領域的引用,全面地介紹了相關技術演化歷史、方法分類、實際應用、技術瓶頸以及未來研究機會與伴隨的風險。

盡管行為基礎模型展現出前所未有的強大能力,其也面臨著重大挑戰,包括 Sim2Real 差距、實體依賴和數據稀缺等問題。在未來的工作中解決這些局限性將有助于開發更可靠、更通用的行為基礎模型。

希望我們的工作能啟發更多相關的后續研究!

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-04 14:35:00

AI機器人

2025-12-04 08:51:00

2024-02-28 12:43:00

數據訓練

2025-02-21 14:53:40

2025-04-21 16:29:15

機器人人形機器人人工智能

2024-06-04 14:16:00

機器人AI

2023-05-22 19:16:09

人工智能機器人

2025-09-04 14:26:55

機器人Figure識別

2024-03-19 13:58:05

Isaac 機器人NVIDIA

2025-11-28 10:15:54

2025-09-08 09:49:07

2025-02-25 10:32:10

2025-03-19 10:05:02

2025-02-21 13:00:00

2022-08-20 17:54:37

機器人開發

2020-08-24 15:55:26

腦機接口機器人工智能
點贊
收藏

51CTO技術棧公眾號

在线日本中文字幕| 亚洲午夜伦理| 7777免费精品视频| 97久久精品人人做人人爽50路| 成人午夜电影网站| 国产色婷婷亚洲99精品小说| 91在线免费看片| 国产suv精品一区二区6| 亚洲h在线观看| 亚洲在线视频福利| a√免费观看在线网址www| 欧美激情一区二区三区在线| 亚洲精美视频| 黄色一级大片在线免费看产| 久久久国产精品| 99久久综合99久久综合网站| 欧美变态凌虐bdsm| 午夜精品在线观看| 亚洲国产精品成人一区二区在线| 色综合久久六月婷婷中文字幕| 色一情一伦一子一伦一区| 麻豆视频在线观看免费网站黄| 欧美日韩一区二区高清| 久久精品女人天堂av免费观看 | 欧美日本网站| 涩涩视频在线免费看| 丁香网亚洲国际| 欧美大香线蕉线伊人久久国产精品| 18禁网站免费无遮挡无码中文| 午夜不卡视频| 国产永久精品大片wwwapp| 老司机一区二区| 三上悠亚一区二区三区| 亚洲精品xxxx| 国产精品日韩在线| 特黄特黄的视频| 国产精品入口麻豆九色| 久久伊人免费视频| 777精品久无码人妻蜜桃| 欧美最新精品| 欧美国产日韩在线观看| 久久精品亚洲国产| 91国产精品视频在线观看| 亚洲三级av| 91日韩在线专区| 午夜精品久久久久久久99黑人| 玖玖玖电影综合影院| 综合色中文字幕| 成人h在线播放| 午夜影院一区| 捆绑紧缚一区二区三区在线观看| 久久久久毛片| 国产欧美日韩精品在线| 亚洲国产精品三区| 成人高潮视频| 亚洲自拍偷拍av| 欧美午夜精品久久久久免费视| 国产精品中文欧美| 国产91热爆ts人妖在线| 白白色在线观看| 国产精品视频第一区| 二区三区在线播放| 国产精品不卡一区| 国产精品99久久久久久大便| av日韩在线播放| 欧洲一区二区日韩在线视频观看免费 | 久久电影国产免费久久电影| www.欧美三级电影.com| 美女做暖暖视频免费在线观看全部网址91| 欧美日韩精品在线观看| 亚洲成人第一| 狠狠色狠色综合曰曰| 欧美一区二区三区婷婷| 日韩美女一区二区三区四区| 激情丁香婷婷| 国产成人亚洲综合色影视| 国产私拍一区| 欧美理伦片在线播放| 在线日韩欧美视频| а√天堂资源地址在线下载| 尤物网址在线观看| 日韩资源在线观看| 欧美一级二区| 欧美二级三级| 91福利精品视频| 神马久久久久| 国产精品成人一区二区| 日韩欧美中文字幕在线视频| 91麻豆精品国产综合久久久久久| 日本中文字幕在线2020| 97欧美精品一区二区三区| 国产一区二区网址| 高清无码视频直接看| 一区二区国产在线| 国产一区二区精品免费| 洋洋成人永久网站入口| 国产美女撒尿一区二区| 欧美专区第一页| 国产福利资源一区| 狠狠色一日本高清视频| 午夜精品福利一区二区三区av | 欧洲日韩一区二区三区| 久久经典视频| 欧美电影一区二区| 久久亚洲影音av资源网| 天堂一区二区在线免费观看| 神马影院午夜我不卡| 久久精品观看| www.av91| 欧美日韩国产成人高清视频| 亚洲精品亚洲人成在线| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 亚洲va久久| 国内精品久久久久久野外| 蜜桃传媒视频麻豆第一区免费观看| 日本一区二区三区视频在线看 | 亚洲va韩国va欧美va精四季| 国产成+人+日韩+欧美+亚洲| 免费在线观看毛片网站| 日本国产亚洲| 日本免费看黄色| 在线观看精品视频| 亚洲欧洲制服丝袜| 伊人网在线免费观看| 亚洲精品久久在线| 一区二区三区午夜视频| 黄色一级片在线观看| 欧美精品无码一区二区三区| 欧美男男青年gay1069videost| 国产亚洲精品bt天堂精选| 图片小说视频色综合| 波多野结衣作品集| 欧洲精品在线观看| 亚洲美女屁股眼交3| 日韩不卡免费高清视频| 在线视频婷婷| 成人在线免费观看| 91精品视频一区| 一本到不卡精品视频在线观看 | 91在线看网站| 91免费视频国产| 成人春色激情网| 欧美国产日本韩| 国产不卡高清在线观看视频| 国内精品久久久久久久97牛牛 | 久久久精品久久久| 亚洲第一精品久久忘忧草社区| 伊人久久婷婷| 福利在线导航136| 亚洲黄色免费av| 亚洲日本免费电影| 99re在线视频播放| 国产91精品不卡视频| 国产精品天干天干在观线| 久久精品一二三| 中文在线日韩| 久色成人在线| 国产精品主播直播| 成人污污视频在线观看| 国产区在线观看成人精品| 亚洲最新视频在线观看| 欧美丝袜第三区| 毛片一区二区三区| 成人免费视频app| 亚洲一卡二卡三卡四卡无卡久久| 国产精品porn| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 日本中文字幕电影在线观看| 亚洲成人动漫在线观看| 成人免费xx| 强伦女教师2:伦理在线观看| 成人激情在线观看| 8x福利精品第一导航| 久久人人爽人人爽人人片av高请 | 国产成人3p视频免费观看| wwwwww.欧美系列| 亚洲男人都懂的| 奇米四色中文综合久久| 精品亚洲综合| 在线一区av| 亚洲夜夜综合| 黄色在线播放网站| 每日更新成人在线视频| 91豆麻精品91久久久久久| 国产一区二区色| 成人网页在线免费观看| 日韩欧美亚洲| 欧美国产综合| 国产精品1024久久| www.久久撸.com| 欧美日韩亚洲一二三| 欧美日本三级| 亚洲高清免费观看高清完整版在线观看| 成人a视频在线观看| 牛牛精品在线视频| 久久a爱视频| 亚洲一级影院| 国产色产综合色产在线视频| 99久久99久久精品国产片桃花 | www.久久精品|