国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

CMU清華MIT引爆全球首個Agent無限流,機器人「007」加班自學停不下來!具身智能被革命

人工智能 新聞
最近,由CMU/MIT/清華/Umass提出的全球首個生成式機器人智能體RoboGen,可以無限生成數據,讓機器人7*24小時永不停歇地訓練。AIGC for Robotics,果然是未來的方向。

全球首個生成式機器人Agent發布了!

長久以來,相比于語言或者視覺模型可以在大規模的互聯網數據上訓練,訓練機器人的策略模型需要帶有動態物理交互信息的數據,而這些數據的匱乏一直是具身智能發展的最大瓶頸。

最近,來自CMU、清華、MIT,UMass等機構的研究人員提出了一種全新的RoboGen智能體。

利用涵蓋在大語言模型和生成式模型中蘊含的大規模知識,配以逼真模擬世界提供的物理信息,可以「無限」生成各種任務、場景以及教學數據,實現機器人7x24小時全自動訓練。

圖片

現在,我們正在迅速耗盡來自網絡的高質量的真實token。全球訓練AI的數據,都快不夠用了。

深度學習之父Hinton表示,「科技公司們正在未來18個月內,要使用比現在GPT-4多100倍的算力訓練新模型」。模型參數更大,算力需求巨大,然而數據在哪里?

面對饑渴的模型,AI合成就是答案。

論文地址:https://arxiv.org/abs/2311.01455

項目主頁:https://robogen-ai.github.io/

開源地址:https://github.com/Genesis-Embodied-AI

具體來說,由MIT-IBM首席科學家淦創帶領的研究團隊,在生成式AI和和可微分物理模擬的加持下,提出了一種「提出-生成-學習」循環,讓Agent能夠自己出題自己訓練機器人。

首先,Agent提出,我們要開發這個技能。

然后,它會生成相應的環境、配置和技能學習指導,來創建模擬環境。

最后,Agent會將提出的上層任務分解為子任務,選擇最佳學習方法,然后學習策略、掌握所提技能。

值得注意的是,整個過程幾乎都不需要人類的監督,而且任務的數量,竟然是——無限個!

對于這則重磅的研究,英偉達高級科學家Jim Fan也進行了轉發。

現在,機器人已經學會一系列炸裂操作——

把物品放到儲物柜中:

圖片

用微波爐加熱一碗湯:

圖片

拉動杠桿沖泡咖啡:

圖片

以及后空翻等等:

圖片

模擬環境,多樣化技能學習的關鍵

機器人研究中,長期存在這樣一個難題:怎樣賦予機器人多種技能,讓它們在非工廠環境中操作,為人類執行廣泛的任務?

近年來,我們教會了機器人各種復雜的技能,比如流體操縱、投擲物體、踢足球、跑酷等等,然而這些技能卻各自為政,視野較短,需要人工設計的任務描述和訓練監督。

因為現實世界數據收集成本高昂且費力,這些技能都是在適當領域隨機化的模擬中訓練,然后部署到現實世界中的。

與現實世界中的探索和數據收集相比,模擬環境具有許多優點,比如提供了低級狀態的特權訪問和無限的探索機會;支持大規模并行計算,數據收集速度顯著加快;允許機器人開發閉環策略和錯誤恢復能力。

然而,構建模擬環境需要一系列繁瑣的任務(設計任務、選擇相關且語義上有意義的資產、生成合理的場景布局和配置、制定獎勵或損失函數等訓練監督)。即使在模擬世界中,也極大限制了機器人技能學習的可擴展性。

圖片

因此,研究者提出一種「生成模擬」范式,將模擬機器人技能學習的進步與基礎和生成模型的最新進展結合起來。

利用最先進的基礎模型的生成能力,生成模擬可以為模擬中各種機器人技能學習所需的所有階段生成信息。

得益于最新基礎模型中全面的編碼知識,以這種方式生成的場景和任務數據,可能與現實世界場景的分布非常相似。

此外,這些模型可以進一步提供分解的低級子任務,這些子任務可以通過特定領域的策略學習方法無縫處理,從而產生各種技能和場景的閉環演示。

RoboGen流程

RoboGen是一種全自動流程,可以7x24h地讓機器人學習各種技能,其中包括4個階段:

1. 任務建議;

2. 場景生成;

3. 訓練監督生成;

4. 利用生成的信息進行技能學習。

圖片

利用最新基礎模型的嵌入式常識和生成功能,RoboGen可以自動生成任務、場景和訓練監督,從而讓機器人的多種技能學習實現規?;?。

任務建議

在這一階段,RoboGen能夠提出上層任務,生成相應的環境,將上層目標分解為底層子任務,然后按順序學習子技能。

首先,RoboGen會生成有意義的、多樣化的、高水平的任務,供機器人學習。

研究者使用特定的機器人類型和從池中隨機采樣的對象,來初始化系統。然后將提供的機器人和采樣對象信息輸入LLM。

這種采樣過程,就確保了生成任務的多樣性。

比如,四足機器人等腿式機器人能夠獲得多種運動技能,而機械臂操縱器在配對時,有可能執行多種操縱任務與不同的采樣對象。

圖片

研究者使用GPT-4在當前的流程中進行查詢。隨后在機械的背景下解釋 RoboGen的詳細信息,以及與對象操作相關的任務。

用于初始化的對象是從預定義的列表中采樣的,包括家庭場景中常見的鉸接式和非鉸接式對象,例如烤箱、微波爐、飲水機、筆記本電腦、洗碗機等。

因為GPT-4接受過大量互聯網數據集的培訓,所以它對這些對象的可供性、如何與它們交互、它們可以與哪些有意義的任務相關聯,都有著豐富的理解。

比如,假設采樣的鉸接物體是微波爐,其中關節0是連接門的旋轉關節,關節1是控制計時器旋鈕的另一個旋轉關節,GPT-4會返回一個任務——「機器人手臂將一碗湯放入微波爐內,關上門并設置微波爐計時器,適當加熱時間a」。

生成的任務所需的其他對象,有一碗湯a,以及與任務相關的關節和鏈接,包括關節0(用于打開微波爐門)、關節1(用于設置定時器)、鏈接0(門)和鏈接1(定時器旋鈕)。

對于鉸接物體,由于PartNetMobility是唯一高質量的鉸接物體數據集,并且已經涵蓋了各種鉸接資產,因此將根據采樣資產生成任務。

通過重復查詢不同的采樣對象和示例,可以生成各種操作和運動任務。

場景生成

給定一個任務,就可以繼續生成相應的模擬場景,以學習完成該任務的技能。

如圖所示,根據任務描述生成場景組件和配置,并檢索或生成對象資產,隨后填充模擬場景。

圖片

場景組件和配置由以下元素組成: 對要填充到場景中的相關資產的查詢、其物理參數(例如大小)、配置 (例如初始關節角度) 以及資產的整體空間配置。

除了上一步中生成的任務所需的必要對象資產之外,為了增加生成場景的復雜性和多樣性,同時類似于真實場景的對象分布,研究者還讓GPT-4返回與任務語義相關對象的附加查詢。

比如,對于任務「打開柜子,將玩具放入其中,然后關上它」,生成的場景還會包括客廳墊子、臺燈、一本書和一把辦公椅。

圖片

訓練監督生成

為了獲得相關技能,就需要對技能學習進行監督。

RoboGen會首先查詢GPT-4,來把長任務規劃和分解為較短范圍的子任務。

一個關鍵假設是,當任務被分解為足夠短的子任務時,每個子任務都可以通過強化學習、運動規劃、軌跡優化等現有算法可靠地解決。

分解后,RoboGen會查詢GPT-4,選擇合適的算法來解決每個子任務。

圖片

RoboGen中集成了幾種不同類型的學習算法: 強化學習、進化策略、基于梯度的軌跡優化、帶有運動規劃的動作初始化。

每一種都適合不同的任務,例如基于梯度的軌跡優化更適合學習涉及軟體的細粒度操作任務,比如將面團塑造成目標形狀。

與運動規劃相結合的動作初始化在解決任務時更加可靠,例如通過無碰撞路徑接近目標對象。

強化學習和進化策略更適合接觸豐富、涉及與其他場景組件持續交互的任務,例如腿部運動,或者當所需的動作不能簡單地通過離散的末端執行器姿勢參數化時,比如轉動一個烤箱的旋鈕。

總之,GPT-4會根據生成的子任務,在線選擇使用哪種算法。

接下來,就可以為機器人構建模擬場景,讓它們學習技能了。

圖片

機器人學會開保險箱

舉個例子,RoboGen會讓機器人去學習調整臺燈方向這種非常精巧的任務。

有趣的是,在這個場景里,地面上竟然還放著像是電腦顯示器這樣的易碎物。

可以說,非??简灆C器人的環境識別能力了。

圖片

對此,RoboGen會生成非常詳盡的操作代碼,包括場景配置、任務分解和監督:

此外,還會訓練一些需要執行很多步驟才能完成的任務,比如讓機器人把保險箱里的東西取出來。

這里就涉及到開門,取物,放下,關門等操作,期間還需要盡量避免與家具產生碰撞。

圖片

RoboGen給出的代碼如下:

或者,諸如讓波士頓動力的人形機器人原地轉個圈,這種在狹小空間中可能會遇到情景。

圖片

代碼如下:

實驗結果

- 任務多樣性

如表1所示,與之前的所有基準相比,RoboGen實現了最低的Self-BLEU和嵌入相似度。也就是說,RoboGen生成任務的多樣性,比人工制作的技能學習基準和數據集還要高!

- 場景有效性

如圖4所示,取消大小驗證會導致BLIP-2分數急劇下降,這是因為Objaverse和PartNetMobility中的物體尺寸,與現實世界的實際尺寸之間存在著巨大差異。此外,沒有對象驗證的BLIP-2得分也較低,而且方差更大。

相比之下,RoboGen中的驗證步驟,可以顯著提高對象選擇的有效性。

- 訓練指導有效性

如圖3所示,機器人在4個長程任務中,基于RoboGen生成的訓練指導(即任務分解和獎勵函數)學習到的技能。

結果表明,機器人成功學習到了完成相應任務的技能。也就是說,自動生成的訓練指導能有效衍生出有意義且有用的技能。

- 技能學習

表2的結果顯示,允許選擇學習算法有利于提高完成任務的性能。如果只使用RL,大多數任務的技能學習都會失敗。

- 系統

如圖1所示,RoboGen可以生成各種任務,用于技能學習,包括剛性/關節物體操作、運動和軟體操作。

而圖3進一步表明,RoboGen能夠以合理的分解方式提供長程操作技能。

作者介紹

圖片

Yufei Wang是卡內基梅隆大學機器人研究所三年級的博士生,導師是Zackory Erickson教授和David Held教授,研究興趣是機器人學習。

此前,他于2020年12月在CMU獲得了計算機科學碩士學位,導師是David Held教授,于2019年7月在北京大學元培學院獲得了數據科學學士學位,導師是Bin Dong教授。

圖片

Zhou Xian是卡內基梅隆大學機器人研究所的一名博士生,導師是Katerina Fragkiadaki。研究興趣是機器人、計算機視覺和世界模型學習。

在進入CMU之前,他在新加坡南洋理工大學完成了學士學位,師從Pham Quang Cuong和I-Ming Chen。并曾在Meta AI、Akshara Rai,以及MIT-IBM AI Lab實習,導師是Chuang Gan。

目前,他的研究重點是為可擴展的機器人學習構建統一的神經策略和仿真基礎設施。

此外,共同一作還有清華姚班的陳楓。

圖片

團隊負責人淦創,現任IBM首席科學家和麻省大學助理教授,是姚期智院士的弟子。在博士期間曾獲得清華特獎,微軟學者,百度學者。他的研究同時得到了Amazon Research Award,Sony Faculty Award,Cisco Faculty Award,Microsoft Accelerate Foundation Models Research Program等資助。

責任編輯:張燕妮 來源: 新智元
相關推薦

2020-05-25 08:05:11

KafkaActiveMQRabbitMQ

2020-02-19 08:08:24

Nginx功能

2020-01-13 12:30:40

服務器開發 架構

2015-08-17 09:44:30

reactivecocios框架實用

2018-08-27 15:57:54

技術短視頻碎片化

2024-12-19 14:44:22

2017-02-17 14:12:21

存儲閃存顆粒固態硬盤

2014-10-21 13:13:30

SSL中間人攻擊中間人攻擊Yahoo

2018-08-01 14:33:56

微信小游戲小程序

2025-11-24 16:50:57

2019-07-29 08:22:59

程序員格子衫代碼

2018-11-12 09:00:33

2014-09-29 16:17:05

易信免費通話

2020-08-17 08:39:12

VSCode開發工具

2024-11-01 09:45:08

2019-10-11 20:15:43

LEGION Y900

2020-08-04 07:45:52

Linux系統游戲

2025-05-20 08:45:00

2025-01-09 12:39:27

點贊
收藏

51CTO技術棧公眾號

九色91视频| 337p日本欧洲亚洲大胆鲁鲁| 91影院成人| 日韩一区二区精品视频| 免费网站看v片在线a| 一区二区三区四区中文字幕| 欧美变态另类刺激| 国产自产2019最新不卡| 久久国产精品99久久久久久丝袜| 精品精品99| 日本精品久久久久久久| 88久久精品| 中文字幕精品一区二区精品| 欧美另类老肥妇| 亚洲国产精品专区久久| 成人欧美在线| 69久久夜色精品国产69蝌蚪网| 宅男视频免费在线观看视频| 亚洲伊人伊色伊影伊综合网| 国产91精品捆绑调教| 自拍偷自拍亚洲精品播放| 激情综合网五月激情 | 成人欧美一区二区三区小说| 真人抽搐一进一出视频| 国产一区二区福利| 国产一级黄色录像片| 国产毛片精品视频| av 日韩 人妻 黑人 综合 无码| 三级在线观看一区二区| 色综合久久av| 国产一区二区三区久久悠悠色av| 亚洲欧美日本国产有色| 日韩成人免费看| av不卡在线免费观看| 国产馆精品极品| heyzo国产| 中文字幕制服丝袜一区二区三区| 亚洲欧美在线精品| 亚洲欧美日韩电影| 日本人妖在线| 精品国产乱码久久久久久牛牛| 女人高潮被爽到呻吟在线观看| 亚洲人成电影网站色www| 四虎影视精品永久在线观看| 国模极品一区二区三区| 99久久亚洲精品| 久久偷窥视频| 成人深夜视频在线观看| aaa一级毛片| 欧美视频你懂的| 欧美电影免费观看| 亚洲91精品在线| 欧美成人首页| 红桃一区二区三区| 成人欧美一区二区三区1314| 国产二区在线播放| 亚洲天堂av网| 日韩激情啪啪| 久久久神马电影| www..com久久爱| 玖玖在线免费视频| 精品国内片67194| 试看120秒一区二区三区| 成人黄色av网| 国内久久精品视频| 九色porn| 亚洲国产精品久久| 一区二区三区自拍视频| 超碰在线观看97| 国产不卡视频一区二区三区| 一级片免费视频| 精品香蕉一区二区三区| 夜夜春成人影院| 亚洲精品一区二区三区四区五区| 亚洲国产精品ⅴa在线观看| 国产毛片av在线| 欧美精品中文字幕一区| 国产精品不卡| 999在线观看视频| 色婷婷久久久亚洲一区二区三区| 3d欧美精品动漫xxxx无尽| 国产精品日韩在线一区| 韩国v欧美v亚洲v日本v| 成人在线小说| 在线成人免费网站| 亚洲午夜久久久久久尤物| 91免费黄视频| 欧美三片在线视频观看 | 成人搞黄视频| 色噜噜一区二区| 亚洲精品国产第一综合99久久| 午夜小视频福利在线观看| 国产精品白嫩初高中害羞小美女| 国产精品18久久久久久久久| 麻豆国产在线播放| 欧美激情免费在线| 久久成人久久鬼色| 国产在线色视频| 热99久久精品| 99久免费精品视频在线观看| 91se在线| 国产欧美日韩视频| 久久综合资源网| 美女高潮视频在线看| 91原创国产| 亚洲老妇xxxxxx| 日本精品国产| av在线播放亚洲| 亚洲欧美日韩国产中文| 亚洲免费婷婷| 欧洲成人av| 国产日韩精品在线播放| 中文字幕人成不卡一区| 日韩一区二区三区四区五区| 国产精品av免费| 精品成人在线观看| 噜噜噜在线观看免费视频日韩| 日本一二三区在线视频| 国产精品久久久久999| 国产精品私人影院| 久久九九精品视频| 欧美日韩黄色一级片| 国产亚洲a∨片在线观看| 日本最新不卡在线| 中文字幕在线播放网址| 国产精品sss| 欧美性一区二区| 一区二区三区午夜探花| 四虎影视在线观看2413| 91精品免费视频| 天涯成人国产亚洲精品一区av| 精品一区av| 中文在线二区| 666精品在线| 欧美色视频在线| 亚洲综合不卡| 免费在线国产视频| 日日噜噜噜夜夜爽爽| 亚洲欧美国产高清va在线播| 成人黄色在线看| 欧美一级在线| 国产免费999| 日本午夜在线亚洲.国产| 亚洲精品视频观看| 香蕉久久网站| 91成人高清| 最新国产精品久久| 久久国内精品一国内精品| 亚洲国产精品99久久久久久久久 | 欧美日韩国产一区二区三区不卡| 97涩在线观看视频| 国产精品久久久久久久久久三级| 亚洲一区免费观看| 欧美jizz| 在线观看麻豆蜜桃| 久久国产一区二区| 亚洲精品狠狠操| 成人免费视频视频在线观看免费| 四虎精品永久免费| 国产女呦网站| 粉嫩av四季av绯色av第一区| 制服丝袜亚洲精品中文字幕| 国产酒店精品激情| av综合网址| 天堂аⅴ在线最新版在线| 高清日韩一区| 亚洲精品色婷婷福利天堂| 91婷婷韩国欧美一区二区| 久久99影视| 国产乱色在线观看| 男人天堂av片| 国产精品一区二区电影| 91精品国产综合久久蜜臀| a亚洲天堂av| 91亚洲一区| 伊伊综合在线| 日本在线аv| 蜜桃麻豆91| 久久国产精品久久精品| 亚洲成年人网站在线观看| 视频精品一区二区| 超碰一区二区三区| 国产一级网站视频在线| 国产又粗又爽又黄的视频 | 欧洲成人一区| 一级黄色在线| 伊人天天久久大香线蕉av色| 午夜精品视频在线| 欧美狂野另类xxxxoooo| 久久久国产精品午夜一区ai换脸| 中文乱码免费一区二区三区下载| 国产美女精品写真福利视频| 免费羞羞视频网站| 日韩电影大全在线观看| 国模gogo一区二区大胆私拍| 3atv在线一区二区三区| 欧美韩国日本一区| 日本成人在线视频网站| 亚瑟一区二区三区四区| 国产在线观看www|