国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

模仿學(xué)習(xí)新范式,Chain-of-Action:軌跡自回歸實(shí)現(xiàn)動(dòng)作推理

人工智能 新聞
Chain-of-Action 提出了一種新穎的模仿學(xué)習(xí)范式,其核心是軌跡自回歸建模。

圖片

論文標(biāo)題:Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation

主頁(yè)鏈接:https://chain-of-action.github.io/

文章鏈接:https://arxiv.org/pdf/2506.09990

代碼鏈接:https://github.com/ByteDance-Seed/Chain-of-Action

模仿學(xué)習(xí)的困境

具身智能(Embodied AI)作為人工智能領(lǐng)域的前沿方向,旨在賦予機(jī)器人或智能體在物理世界中感知、決策和行動(dòng)的能力。近年來(lái),盡管視覺(jué) - 語(yǔ)言 - 動(dòng)作模型(Vision Language Action, VLA)已經(jīng)取得了諸多進(jìn)展,但具身智能領(lǐng)域尚未迎來(lái) 「GPT 時(shí)刻」。越來(lái)越多的研究人員開(kāi)始相信,僅僅增加模型規(guī)模和數(shù)據(jù)量似乎不足以創(chuàng)造出通用操作模型,如果我們想要充分釋放現(xiàn)有數(shù)據(jù)的潛力,就需要找到更有效的機(jī)器人操作建模方法。

來(lái)自字節(jié)跳動(dòng) Seed & 阿德萊德大學(xué)的研究者追根溯源,對(duì)模仿學(xué)習(xí)的基本范式進(jìn)行了反思,發(fā)現(xiàn)現(xiàn)有建模思路或許存在缺陷:經(jīng)典方法如 ACT、Diffusion Policy(DP)都遵循 「前向預(yù)測(cè)」(forward-prediction)范式。而然這種方式不可避免地存在較大的復(fù)合誤差(compounding error)。

在該范式下,策略通常被優(yōu)化為基于當(dāng)前觀察預(yù)測(cè)短期的下一步動(dòng)作,而非確保最終能夠成功完成整個(gè)任務(wù)。雖然引入了動(dòng)作分塊(action chunking)等策略來(lái)緩解復(fù)合誤差,但無(wú)法解決其固有的 「短視性」問(wèn)題。

基于該局限,研究者提出了 「動(dòng)作鏈」(Chain-of-Action, CoA)—— 一種基于軌跡自回歸的機(jī)器人操作策略。與經(jīng)典范式區(qū)分,CoA 并不直接由觀察映射到執(zhí)行動(dòng)作,而是由從最終位置反向自回歸的生成軌跡點(diǎn),推理出可執(zhí)行的動(dòng)作。研究團(tuán)隊(duì)初步發(fā)現(xiàn),僅僅通過(guò)修改建模方式,CoA 在與 ACT 保持相同的基本結(jié)構(gòu)下,空間泛化能力顯著提升。這種建模方式為具身操作策略的建模提供了新的思路。

動(dòng)作鏈:基于軌跡自回歸建模的

機(jī)器人操作策略

核心思想:受到思維鏈(Chain-of-Thought)的啟發(fā),CoA 并不直接由觀察映射到執(zhí)行動(dòng)作,而是在動(dòng)作層面進(jìn)行迭代式的推理。具體來(lái)說(shuō),CoA 逆向的生成針對(duì)目標(biāo)任務(wù)的完整軌跡,這個(gè)生成過(guò)程統(tǒng)一在一個(gè)自回歸網(wǎng)絡(luò)下。自回歸過(guò)程從 「關(guān)鍵幀動(dòng)作」(keyframe action)開(kāi)始,迭代地生成一連串完整的動(dòng)作軌跡,直至當(dāng)前的機(jī)器人夾爪的位置。

全局到局部一致性:這種 「從后往前」 的生成方式,為整個(gè)動(dòng)作序列提供了的 「全局 - 局部」(global-to-local)結(jié)構(gòu)性約束。因?yàn)槊總€(gè)后續(xù)生成的動(dòng)作都以代表最終目標(biāo)的 「關(guān)鍵幀」 為條件,所以最后執(zhí)行的動(dòng)作將會(huì)被最終目標(biāo)所 「錨定」,空間泛化能力顯著得到增強(qiáng)。

統(tǒng)一的自回歸框架:CoA 將關(guān)鍵幀的識(shí)別和軌跡的生成統(tǒng)一在單一的自回歸模型中,實(shí)現(xiàn)了端到端的訓(xùn)練和高效的閉環(huán)執(zhí)行,并保持了可擴(kuò)展(scalable)的潛力。

圖片

關(guān)鍵設(shè)計(jì)

為了實(shí)現(xiàn)軌跡自回歸的想法,CoA 引入了四個(gè)關(guān)鍵設(shè)計(jì):

連續(xù)動(dòng)作表征(Continuous Action Representation):離散化的動(dòng)作表征會(huì)引入量化誤差,為保證軌跡的精細(xì)度,CoA 采用了連續(xù)的動(dòng)作表征并引入了 「潛在一致性損失」(Latent consistency loss)。

動(dòng)態(tài)停止機(jī)制(Dynamic Stopping):在連續(xù)動(dòng)作空間中,沒(méi)有傳統(tǒng)的中止符(EOS token)來(lái)指示序列的結(jié)束。因此,CoA 設(shè)計(jì)了一種基于距離的動(dòng)態(tài)停止機(jī)制,實(shí)現(xiàn)可變長(zhǎng)度(variable length)的軌跡預(yù)測(cè)。

反向時(shí)間集成(Reverse Temporal Ensemble):傳統(tǒng)的時(shí)序集成策略基于前向時(shí)間假設(shè),不適用于 CoA 的反向生成模式。CoA 通過(guò)反向時(shí)序集成,進(jìn)一步提高預(yù)測(cè)的穩(wěn)定性。

多詞元預(yù)測(cè)(Multi-token Prediction, MTP):動(dòng)作局部依賴(lài)關(guān)系的建模可作為 「全局 - 局部」 一致性的補(bǔ)充。此設(shè)計(jì)僅在訓(xùn)練階段作為正則化手段使用,在推理時(shí)移除,保證了效率。

圖片

圖片

圖片

實(shí)驗(yàn)驗(yàn)證

模擬環(huán)境測(cè)試

大幅超越基線:在涵蓋 60 個(gè)任務(wù)的 RLBench 大規(guī)模擬基準(zhǔn)測(cè)試中,CoA 的平均成功率達(dá)到了 55.2%,顯著優(yōu)于 ACT(38.9%)和 DP(32.6%)。相較于 ACT,CoA 在 81.7% 的任務(wù)中取得了更高的成功率,平均提升了 16.3%。相較于 DP,CoA 在 80.0% 的任務(wù)上表現(xiàn)更優(yōu),平均提升為 23.2%。

圖片

相關(guān)性分析:所有方法的成功率都隨著物體空間分布方差的增大而下降,但 CoA 的下降趨勢(shì)更為平緩,且其性能優(yōu)勢(shì)在高方差(更困難)的任務(wù)中更為明顯。

圖片

空間泛化能力分析:研究者對(duì)泛化性進(jìn)行了更細(xì)致的觀察。以按按鈕任務(wù)為案例,分別測(cè)試了 「內(nèi)插」(in-distribution)和 「外推」(out-of-distribution)情況下各個(gè)模型的表現(xiàn),結(jié)果顯示,CoA 在外推場(chǎng)景下成功率約為內(nèi)插情況下的一半,但對(duì)于 ACT 和 DP,外推任務(wù)幾乎不能完成,這一定程度揭示了兩種建模范式在空間泛化表現(xiàn)上的根本差異。

圖片

真實(shí)世界實(shí)驗(yàn)

研究者在一臺(tái) Fetch 機(jī)器人上,圍繞 8 項(xiàng)廚房任務(wù)進(jìn)行了部署和測(cè)試。觀察來(lái)自單個(gè) RGB 攝像頭,策略以 10Hz 的頻率運(yùn)行,每個(gè)任務(wù)測(cè)試 10 次。實(shí)驗(yàn)結(jié)果顯示 CoA 取得了 61.3% 的平均成功率,ACT 成功率為 46.3%,DP 的成功率 36.3%。這驗(yàn)證了 CoA 建模范式在真實(shí)世界中的可用性。

圖片

結(jié)論與展望

Chain-of-Action 提出了一種新穎的模仿學(xué)習(xí)范式,其核心是軌跡自回歸建模。通過(guò)從一個(gè)代表任務(wù)目標(biāo)的 「關(guān)鍵幀」開(kāi)始,逆向生成動(dòng)作序列,該方法為軌跡施加了一個(gè)強(qiáng)大的 「全局 - 局部」 結(jié)構(gòu)約束,從而有效解決累計(jì)誤差問(wèn)題,提升機(jī)器人操作泛化性。全面的實(shí)驗(yàn)結(jié)果證明,在沒(méi)有更多數(shù)據(jù)和增大模型規(guī)模的情況下,其在空間泛化能力相比傳統(tǒng)范式取得顯著提升。這說(shuō)明一個(gè)合理的建模范式可以有效的釋放現(xiàn)有數(shù)據(jù)的潛力。CoA 有望為未來(lái)一代的 VLA 模型提供新的建模思路。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-10-21 09:06:00

2025-06-09 09:32:35

2025-10-23 14:05:35

2022-11-03 14:13:52

強(qiáng)化學(xué)習(xí)方法

2025-11-10 08:00:00

AI模型LLM

2025-06-13 08:45:00

數(shù)據(jù)模型可視化

2011-08-11 18:00:18

Cocos2d動(dòng)作Action

2025-06-26 09:06:59

2025-07-14 08:42:00

開(kāi)發(fā)模型圖像生成

2025-09-03 09:09:00

2025-04-08 09:16:00

推理模型AI

2020-04-15 16:44:38

谷歌強(qiáng)化學(xué)習(xí)算法

2019-03-08 09:28:42

Google 開(kāi)源技術(shù)

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-05-30 02:00:00

獎(jiǎng)勵(lì)模型RRMAI

2025-11-04 01:43:00

循環(huán)語(yǔ)言模型架構(gòu)

2025-06-27 10:10:43

AI模型技術(shù)

2025-10-28 08:46:00

2025-05-21 13:52:39

LLM模型

2023-02-08 15:32:56

新模塊操作系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

一区在线免费| 国产91富婆露脸刺激对白 | 国产精品久久久久91| 四虎影院在线播放| 国产精品伊人色| av成人在线电影| 丝袜久久网站| 日韩在线视频播放| 国产黄色大片在线观看| 欧美性猛交xxxx黑人猛交| 天天操天天爽天天射| 狠狠狠色丁香婷婷综合久久五月| 亚洲综合精品伊人久久| 色婷婷av一区二区三区丝袜美腿| 国产午夜精品视频| 99久久精品免费观看国产| 欧美日韩国产限制| 国产精品久久久久久久久久久久 | gogogo高清在线观看免费完整版| 国产精品久久777777毛茸茸 | 国产精品一区二区三区精品| 亚洲综合av影视| 国产成人精品视频| 91色视频在线观看| hd国产人妖ts另类视频| 久久精品电影网站| 国产精品四虎| 亚洲自拍与偷拍| 高清一区在线观看| 国产福利一区二区三区| 亚洲欧美国产精品桃花| 一本综合久久| 国产伦精品一区二区三区四区视频| 国产精品密蕾丝视频下载| 欧美精品www| 日韩三级av高清片| 久久夜精品va视频免费观看| 亚洲第一会所| 亚洲欧洲在线视频| 日韩欧美精品一区二区三区| 亚洲精品在线观看视频| 欧美色图天堂| 日韩精品免费在线| 成人影院av| 日韩在线一区二区三区免费视频| 成人天堂yy6080亚洲高清| 精品国产sm最大网站| 97蜜桃久久| 揄拍成人国产精品视频| 成人豆花视频| 韩国福利视频一区| 色婷婷色综合| 精品视频在线观看| 久久激情婷婷| 精品国产一区二区三区在线| 北岛玲一区二区三区四区| 成人在线免费观看av| 国产欧美1区2区3区| 五月综合激情在线| 亚洲一区二区在线免费看| 蜜桃成人在线视频| 日韩一区二区三区视频在线| 卡通欧美亚洲| 久久久久久噜噜噜久久久精品| 国产九一精品| 91沈先生播放一区二区| 久久久青草婷婷精品综合日韩| 伊人色综合影院| 91老师片黄在线观看| 国产jizz| 7777精品久久久大香线蕉| 欧美电影免费观看| 国内精品在线一区| 欧美一区高清| 97超碰免费观看| 国产精品久久久久久久久动漫 | 欧美大片在线免费观看| 亚洲成人黄色| 91精品中文在线| 三级成人在线视频| 国产a级一级片| 好吊成人免视频| www视频在线观看| 国内精品小视频| 99日韩精品| 99色精品视频| 欧洲亚洲国产日韩| 九九久久国产| 亚洲精品欧美日韩专区| 国产福利一区二区三区在线视频| 91美女在线免费观看| 日韩三级在线免费观看| av男人一区| 国产青春久久久国产毛片| 久久综合狠狠综合久久综合88| 色哟哟在线观看| 久久精品国产69国产精品亚洲| 91精品一区二区三区综合在线爱| 中文字幕第50页| 欧美午夜性色大片在线观看| jizzjizz少妇亚洲水多| 97人摸人人澡人人人超一碰| 成人午夜免费视频| 成人资源www网在线最新版| 日韩在线资源网| 9久re热视频在线精品| 91极品尤物在线播放国产| 日韩精品一区二区三区三区免费| 久久精品国产亚洲5555| 亚洲精品一区二区毛豆| 亚洲第一av色| 麻豆视频久久| 一区二区视频在线播放| 五月开心婷婷久久| 日韩电影精品| 美日韩免费视频| 亚洲一区二区精品久久av| 欧洲亚洲精品| 色涩成人影视在线播放| 亚洲成人777| 91麻豆精品激情在线观看最新 | 亚洲日本欧美在线| 亚洲午夜精品17c| 欧美在线se| 亚洲精品一品区二品区三品区| 精品久久久视频| 日韩精品一区二区三区免费视频| 亚洲欧洲精品在线观看| 色琪琪一区二区三区亚洲区| 亚洲性视频大全| 无码精品国产一区二区三区免费| 亚洲激情小视频| 性久久久久久| yiren22综合网成人| 国产精品久久久久国产a级| 国产午夜精品一区二区三区视频| 麻豆免费在线| 色涩成人影视在线播放| 欧美午夜免费电影| 久久视频在线| 丁香六月婷婷| 欧美一级电影免费在线观看| 国产欧美视频在线观看| 亚洲成a人片777777久久| 欧美视频在线观看视频| 亚洲美腿欧美激情另类| 久久国产麻豆精品| av中文字幕在线看| 伊人精品久久久久7777| 亚洲国模精品私拍| 韩国欧美一区二区| 精品众筹模特私拍视频| 欧美日韩视频免费在线观看| 亚洲精品久久久久中文字幕欢迎你 | 色天使色偷偷av一区二区| 国产欧美日韩免费观看| 国产对白国语对白| 国语自产精品视频在线看一大j8 | 欧美视频一区二| 中文字幕亚洲精品乱码 | 99久久精品国产麻豆演员表| 中文字幕乱码中文乱码51精品| 在线一区日本视频| 亚洲精品视频久久| 国产传媒久久文化传媒| 国产私拍福利精品视频二区| 久久国产精品视频在线观看| xxxxx91麻豆| 国产精品白丝在线| 日韩视频1区| 国产免费区一区二区三视频免费| 欧洲日本在线| 中文字幕乱码一区二区三区| 在线播放91灌醉迷j高跟美女 | 国产伊人久久| 免费看黄色a级片| 中文字幕欧美精品在线| 不卡一区二区三区四区| 国产激情久久| 男人的天堂日韩| 日产精品久久久一区二区福利| 午夜精品在线视频一区| 国产欧美在线| 欧美日韩大片| 天天操天天爱天天爽| 国产精品欧美激情| 欧美视频完全免费看| 国内精品写真在线观看| 日韩中文字幕无砖| 夜鲁很鲁在线视频| 性欧美videosex高清少妇| 色青青草原桃花久久综合| 国产精品每日更新在线播放网址| 精品午夜久久| 人人澡人人添人人爽一区二区| 欧美精品自拍视频| 国产www精品| 欧美成人vr18sexvr| 日本一区二区三区在线不卡 | 亚洲东热激情|