国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

AI無師自通,搞定所有家務(wù)!π0.5突破泛化極限,UC伯克利系出品

人工智能
具身智能最大的挑戰(zhàn)在于泛化能力 ,即在陌生環(huán)境中正確完成任務(wù)。最近,Physical Intelligence推出全新的π0.5 VLA模型,通過異構(gòu)任務(wù)協(xié)同訓(xùn)練實現(xiàn)了泛化,各種家務(wù)都能拿捏。

近年來,機器人取得了顯著進展,能表演雜技、跳舞、聽從指令,甚至完成疊衣服、擦桌子等復(fù)雜任務(wù)。但機器人面臨的最大挑戰(zhàn)并非靈活性,而是泛化能力——在新環(huán)境中正確完成任務(wù)的能力。

想象一個你家中的清潔機器人:每個家庭布局不同,物品擺放各異,機器人必須在多個層面上實現(xiàn)泛化。低層面上,它需學(xué)會如何抓起未曾見過的勺子或盤子;高層面上,它要理解任務(wù)語義,如衣服應(yīng)放進洗衣籃、用何種工具擦拭溢出物。實現(xiàn)這種能力既依賴強大的操作技能,也需要常識理解,而現(xiàn)實中可用于訓(xùn)練的數(shù)據(jù)又極其有限,這進一步增加了困難。

即使近年來的機器人在靈巧性方面有所突破,往往也是基于特定場景和相似數(shù)據(jù)訓(xùn)練出來的。

因此,如果我們希望機器人成為我們?nèi)粘I畹囊徊糠郑谖覀兊募抑小㈦s貨店、辦公室、醫(yī)院和其他“雜亂”的環(huán)境中工作,機器人就必須具備更加強大的泛化能力。

今天,美國具身智能公司 Physical Intelligence 推出了一個基于 π0 的視覺-語言-動作(VLA)模型 π0.5,其利用異構(gòu)任務(wù)的協(xié)同訓(xùn)練來實現(xiàn)廣泛的泛化,可以在全新的家中執(zhí)行各種任務(wù)。

實驗表明,這種知識遷移對于有效的泛化至關(guān)重要,而且他們首次證明,端到端學(xué)習(xí)型機器人系統(tǒng)可以在全新的家庭中執(zhí)行長程靈巧操作技能,例如清潔廚房或臥室。

π0.5是如何工作的?

π0.5 背后的主要原理是異構(gòu)數(shù)據(jù)的共同訓(xùn)練:通過在各種不同的數(shù)據(jù)源上訓(xùn)練 VLA 模型,不僅可以教它如何物理地執(zhí)行不同的技能,還可以教它如何理解每項技能的語義背景,推斷任務(wù)的高級結(jié)構(gòu),甚至從其他機器人轉(zhuǎn)移物理行為。

協(xié)同訓(xùn)練的概念很簡單:由于 VLA 源自通用的視覺語言模型(VLM),因此它們可以在包含動作、圖像、文本和其他多模態(tài)標(biāo)注(例如邊界框)的任意組合的示例上進行訓(xùn)練。這包括通用的多模態(tài)任務(wù),如圖像字幕、視覺問答或物體檢測;面向機器人的任務(wù),如帶有動作的機器人演示;以及“高級”機器人示例,這些示例由帶有適當(dāng)語義行為標(biāo)記的觀察結(jié)果組成。演示還包含“口頭指令”,即一個人通過自然語言一步步指導(dǎo)機器人完成一項復(fù)雜任務(wù)。該模型既可以對下一步要執(zhí)行的語義步驟進行高級推理(類似于思路鏈推理),也可以進行低級預(yù)測,以向機器人的關(guān)節(jié)輸出運動指令。

圖片

圖|π0.5 的協(xié)同訓(xùn)練任務(wù)示意圖,其中包括來自多種不同機器人類型的各種機器人數(shù)據(jù)源,以及包括高級子任務(wù)指令、指示和網(wǎng)絡(luò)數(shù)據(jù)在內(nèi)的多模態(tài)數(shù)據(jù)。

雖然協(xié)同訓(xùn)練的基本原理并非新事物,但訓(xùn)練一個能夠廣泛泛化的 VLA 需要合理地組合協(xié)同訓(xùn)練任務(wù)。VLA 需要由多種協(xié)同訓(xùn)練任務(wù)組成的“課程”,以便在所有必要的抽象層次上實現(xiàn)泛化。在實驗中,他們訓(xùn)練了 π0.5 模型的不同版本,這些版本排除了完整訓(xùn)練混合的不同部分,只留下使用在實驗中使用的相同機器人收集的移動操作數(shù)據(jù)(約 400 小時)。

圖片

圖|評估完整的 π0.5 訓(xùn)練混合與排除各種數(shù)據(jù)源的消減相比。網(wǎng)絡(luò)數(shù)據(jù)(WD)在泛化到分布外對象方面的差異最大,而來自其他機器人(ME 和 CE)的數(shù)據(jù)在所有評估條件下都很重要。

他們評估了兩種實驗條件:全面清潔任務(wù);以及分布外泛化(OOD)評估,要求機器人將提示中指示的特定物體移入抽屜。對于這兩種評估,都測量了成功率和語言理解率。在所有情況下,來自其他機器人(ME 和 CE)的數(shù)據(jù)對策略性能產(chǎn)生了巨大影響。在 OOD 案例中,他們還發(fā)現(xiàn)與包含網(wǎng)絡(luò)數(shù)據(jù)(WD)的策略性能存在差異,這提高了機器人正確識別數(shù)據(jù)中未包含的新物體類別的能力。

為了更好地量化 π0.5 能夠?qū)崿F(xiàn)的泛化程度,他們進行了一項擴展研究,其中改變了訓(xùn)練數(shù)據(jù)中不同環(huán)境的數(shù)量。他們還在比較中加入了基線模型,該模型使用所有其他數(shù)據(jù)源的數(shù)據(jù)外,還直接使用來自測試環(huán)境的數(shù)據(jù)進行訓(xùn)練。該模型(用水平綠線表示)可以直觀地了解,如果消除了泛化到新環(huán)境的挑戰(zhàn),VLA 在該場景中的表現(xiàn)如何。

圖片

圖|評估在與訓(xùn)練混合中的其他數(shù)據(jù)集共同訓(xùn)練時,性能如何隨訓(xùn)練環(huán)境的數(shù)量而變化。當(dāng)使用所有可用的訓(xùn)練環(huán)境時(圖中最右邊一點),π0.5(黃色)與直接在測試環(huán)境(綠色)中訓(xùn)練的基線模型性能相似。

這些結(jié)果不僅表明,π0.5 的泛化性能會隨著訓(xùn)練集中不同環(huán)境數(shù)量的增加而穩(wěn)步提升,而且僅僅經(jīng)過大約 100 個訓(xùn)練環(huán)境,它的性能就接近了直接在測試環(huán)境中訓(xùn)練的基線模型。

訓(xùn)練和推理

π0.5 構(gòu)建于 π0 VLA 基礎(chǔ)之上,經(jīng)過聯(lián)合訓(xùn)練,能同時輸出動作和文本標(biāo)簽,因此可在高層和低層控制機器人。在運行時,它先生成一個文本形式的“高級”動作,再細(xì)化為一組連續(xù)的低級關(guān)節(jié)動作(每組稱為一個 50 步的“動作塊”)來執(zhí)行該動作。

這一流程延續(xù)了他們此前的 Hi Robot 系統(tǒng)思路,不同之處在于 π0.5 將高級決策與低級控制統(tǒng)一由同一模型完成,類似于“思維鏈”模式。

模型本身包含離散自回歸 token 解碼和通過流匹配進行的連續(xù)解碼,例如 π0。離散解碼路徑用于推斷高級動作,而連續(xù)流匹配路徑用于推斷低級運動命令。

圖片

圖|π0.5 使用的高層/低層推理程序。該模型首先生成一個用語言表達(dá)的高級動作,基本上是“告訴自己”應(yīng)該采取什么步驟來完成任務(wù),然后利用其流程匹配動作專家來選擇運動指令。

如果換個房子試試呢?

他們通過讓 π0.5 控制機械手,在訓(xùn)練數(shù)據(jù)中從未見過的新房屋中完成清潔任務(wù),以評估其泛化能力。對 VLA 來說,這是極具挑戰(zhàn)的測試。盡管 VLA 曾展現(xiàn)出出色的泛化能力,如理解語義指令、與人互動、組合技能等,但這些能力多在與訓(xùn)練環(huán)境相似的場景中實現(xiàn)。

此前,他們的 π0-FAST 雖能通過 DROID 系統(tǒng)推廣到新環(huán)境,但僅限于如移動物體等簡單任務(wù)。而此次實驗中,π0.5 被放入全新家庭,需完成收拾碗碟、整理床鋪、清潔地板等復(fù)雜任務(wù)。這些任務(wù)不僅耗時,還要求機器人執(zhí)行如用海綿擦拭等復(fù)雜動作,理解任務(wù)語義,并將其拆解為多個環(huán)節(jié),每步都需與正確的物體互動。

最后,π0.5 模型可以接受不同粒度的語言命令,從“把盤子放進水槽”這樣的高級提示,到指示模型拾取特定物體或朝特定方向移動的詳細(xì)單個命令。他們在下方視頻中展示了一些語言跟隨的示例。

下一步:更泛化的物理智能

這項工作表明,VLA 能夠?qū)崿F(xiàn)出色的泛化能力,即便面對如清潔廚房或臥室這樣復(fù)雜且多變的機器人任務(wù),也能有效應(yīng)對。π0.5 能夠讓機器人完成在訓(xùn)練數(shù)據(jù)中從未遇到過的新家庭環(huán)境的清潔任務(wù)。

盡管 π0.5 還不夠完美,常在高級語義推理和動作執(zhí)行指令方面出現(xiàn)錯誤,但研究人員希望,通過讓機器人從多樣的知識來源中學(xué)習(xí),π0.5 能夠幫助我們更接近實現(xiàn)廣泛泛化、靈活應(yīng)變的物理智能。

目前,這些機器人可以通過語言反饋進行改進;未來,它們還可能借助自主經(jīng)驗,在更少監(jiān)督的情況下不斷優(yōu)化,或在不熟悉的情境中主動請求幫助和建議。盡管如此,在知識遷移、模型構(gòu)建技術(shù),以及數(shù)據(jù)來源的多樣性等方面,仍有大量進步空間。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-07-14 13:47:29

2024-02-19 13:46:04

多模態(tài)信息LWMtoken

2025-01-22 15:21:00

2022-03-28 13:25:42

AI扶貧機器之心

2025-04-18 08:42:52

模型推理AI

2023-04-04 13:17:00

GPUCMU開源

2023-04-07 09:28:31

模型訓(xùn)練

2023-09-25 12:42:00

AI數(shù)據(jù)

2025-10-11 15:55:08

AI模型數(shù)據(jù)

2023-08-05 13:45:46

模型AI

2023-05-04 14:55:02

模型AI

2023-12-16 09:49:18

2024-12-18 07:20:00

2021-11-29 16:12:38

AI數(shù)據(jù)強化學(xué)習(xí)

2023-11-14 07:47:42

IGN擴散模型

2024-09-11 13:04:53

2023-08-15 14:18:19

智能研究

2023-07-15 23:54:57

GPT-4AI谷歌

2025-04-09 09:34:00

2024-11-26 13:40:00

點贊
收藏

51CTO技術(shù)棧公眾號

久久不见久久见免费视频7| 国产精品福利在线观看播放| 国产精品嫩草影院av蜜臀| 国产美女在线精品免费观看| 日本中文字幕一区二区| 天天影视涩香欲综合网| 国产免费黄视频| 老司机精品视频网站| 国产精品都在这里| 亚洲综合伊人| 欧美成人精品二区三区99精品| 黄a大片av永久免费| 成人av午夜影院| 国模精品娜娜一二三区| 尤物tv在线精品| 久久大大胆人体| 美女的胸无遮挡在线观看| 欧洲av在线精品| 淫视频在线观看| 久久精品亚洲乱码伦伦中文| dy888午夜| 日本欧美加勒比视频| 亚洲最大福利视频网| 亚洲精品亚洲人成在线观看| 久久久久99精品久久久久| 97天天综合网| 日韩一区二区三区av| 北岛玲一区二区三区| 五月激情综合网| 中国一级特黄毛片大片| 亚洲男人都懂的| 激情校园亚洲图片| 国产免费久久精品| 熟女人妇 成熟妇女系列视频| 国产成人免费在线视频| 日韩人妻一区二区三区蜜桃视频| 精品中文av资源站在线观看| 亚洲一区二区三区精品视频| 久久国产生活片100| 在线视频不卡一区二区三区| 国产一区二区三区久久| 精品国产免费久久久久久尖叫| 亚洲人metart人体| 亚洲在线www| 激情视频一区| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 超碰在线免费播放| 国产无人区一区二区三区| 天堂中文在线视频| 精品人在线二区三区| av男人的天堂网| thepron国产精品| 手机在线免费观看av| 亚洲女人视频| 中文字幕亚洲在线| 国内成+人亚洲+欧美+综合在线 | 国产精品久久久久高潮| 国产精品欧美精品| 成人在线视频中文字幕| 日本一区二区在线| 欧美综合一区二区| 在线视频三级| 日产精品一线二线三线芒果| 欧美视频一区二区三区在线观看| 一区在线影院| 激情综合网婷婷| 成人午夜视频网站| 曰本一区二区三区视频| www.久久久精品| 国模极品一区二区三区| 国产精品一区二区在线看| 在线看黄色av| 欧美激情第99页| 国产精品一二三四| 波多野结衣精品| 亚洲欧洲一区二区福利| 精品亚洲男同gayvideo网站| 成人黄页网站视频| 国产精品18久久久久久首页狼| 日本不卡一区二区| 你懂的在线播放| 成人免费视频网| 中文字幕一区二区视频| 成人久久网站| 日韩黄色影院| 中文字幕人成一区| 欧美精品一区二区在线播放| 奇米影视亚洲| 蜜桃视频m3u8在线观看| 国产精品区一区二区三在线播放| 欧美全黄视频| 成年丰满熟妇午夜免费视频 | 亚洲最大的成人av| 在线āv视频| 韩国欧美亚洲国产| 国产精品久久久久久久久久妞妞| 国产乱子伦精品视频| 亚洲免费电影在线| sis001亚洲原创区| 欧美亚洲国产精品| 老司机免费视频一区二区三区| 日韩av在线中文| 欧美sm美女调教| 青青草国产成人a∨下载安卓| 咪咪色在线视频| 婷婷开心激情综合| 日韩一区二区三免费高清在线观看| 亚洲一区二区三区乱码aⅴ| 成人精品gif动图一区| 激情在线视频| 久久久中文字幕| 激情深爱一区二区| 黄色在线播放| 欧美激情精品久久久久久黑人| 久久国产精品亚洲77777| 麻豆免费网站| 久久久精品国产亚洲| 香蕉国产精品偷在线观看不卡| 亚洲免费一级视频| 亚洲视频777| 一本色道88久久加勒比精品| 国产二级片在线| 久久久精品国产一区二区| 日韩av高清在线观看| 天堂a中文在线| 欧美一级高清免费| 99久精品国产| 色偷偷色偷偷色偷偷在线视频| 国产精品国产精品| 亚洲一区二区欧美日韩| 日韩有吗在线观看| 隔壁人妻偷人bd中字| 精品奇米国产一区二区三区| 欧美日韩1区| 中文资源在线网| 97精品国产97久久久久久| 成人va在线观看| av电影在线免费| 久久久久天天天天| 色综合网色综合| 欧美日韩国产免费观看视频| 无限资源日本好片| 久久大大胆人体| 国产a精品视频| 午夜欧美激情| 一本一生久久a久久精品综合蜜 | 亚洲色图在线观看| 日韩激情一区二区| av电影在线观看网址| 91亚洲精品久久久| 亚洲成人精品在线观看| 亚洲激情播播| 成年在线播放小视频| 午夜精品一区二区三区在线视| 2014亚洲片线观看视频免费| 成人精品高清在线视频| 国产一级大片免费看| 亚洲精品久久久一区二区三区| 日韩成人精品在线| 四虎影视国产在线视频| 奇米视频888战线精品播放| 欧美日本在线看| 久久不射网站| 国精产品一区一区三区mba下载| 日韩精品在在线一区二区中文| 欧美xxx久久| 喷白浆一区二区| 在线观看欧美日韩电影| 精品一区二区成人免费视频| 亚洲精品中文字幕女同| 国产精品亚洲а∨天堂免在线| 成人黄色在线| 免费看污黄网站| 国产精品爱啪在线线免费观看| 亚洲成av人片在线| 亚洲精品日本| 热色播在线视频| 成人午夜免费在线视频| 久久精品国产精品| 国产欧美日韩在线| 日本成人小视频| 免费av在线网站| 国产精品av免费| 欧美xxxx18性欧美| 午夜精品影院在线观看| 国产精品一页| 成人看片网页| 国精产品999国精产品官网| 官网99热精品| 国产亚洲欧美日韩精品| 亚洲少妇中出一区| 伊人成人在线视频| 女生影院久久| 超碰色偷偷男人的天堂| 国产视频一区二区不卡| 亚洲精品久久久久久久久| 国产色婷婷亚洲99精品小说| 66视频精品| 欧美色999| 亚洲女成人图区|