国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

當GPT-4V充當機器人大腦,可能你都沒AI會規劃

人工智能 新聞
來自清華大學交叉信息研究院的研究者提出了「ViLa」(全稱 Robotic Vision-Language Planning)算法,其能在非常復雜的環境中控制機器人,為機器人提供任務規劃。

GPT-4V 已經能幫我們設計網站代碼,控制瀏覽器,這些應用集中在虛擬數字世界中。假如我們把 GPT-4V 帶入現實世界,讓它作為控制機器人的大腦,會有什么有趣的結果呢?

最近,來自清華大學交叉信息研究院的研究者提出「ViLa」算法,實現了讓 GPT-4V 走進物理世界中,為機器人操作日常生活物品提供任務規劃。

圖片

ViLa 全稱是 Robotic Vision-Language Planning,它利用 GPT-4V 在視覺和語言兩個模態上做聯合推理的能力,把抽象的語言指令分解為一系列可執行的步驟。ViLa 最讓人驚喜的是它展現出對物理世界中常識的理解,而這是很多之前基于大語言模型(LLM)的機器人任務規劃算法所欠缺的。

比如在下面這個視頻中,研究人員讓機器人拿出擱板上的漫威模型(鋼鐵俠)。ViLa 能理解這個場景中物體的復雜空間位置關系,即紙杯和可樂罐擋住了鋼鐵俠,要拿出鋼鐵俠,則必須先拿走紙杯和可樂罐。

圖片

又比如在下面這個視頻中,研究人員讓機器人為上美術課的孩子們整理出一個桌面區域。ViLa 能根據這個場景中的剪紙,推斷出現在上課所需的工具是剪刀,把其它危險物品,比如螺絲刀和水果刀放入收納盒中。

圖片

可以看出,ViLa 具有像人類一樣的常識,能在非常復雜的環境中控制機器人,為機器人提供任務規劃。

圖片

  • 論文地址:https://arxiv.org/pdf/2311.17842.pdf
  • 論文主頁:https://robot-vila.github.io/
  • 論文視頻:https://www.youtube.com/watch?v=t8pPZ46xtuc

接下來,該研究詳細介紹了 ViLa 這項研究成果。

方法介紹

ViLa 使用了視覺語言大模型 (VLM) 來做機器人的任務規劃。如今的 VLM 在圖像和語言兩個模態上都展現出前所未有的理解和推理能力。將 VLM 應用到機器人任務中,它能基于當前環境的視覺觀測,結合自己豐富的世界知識進行推理。作者團隊提出了 ViLa 算法,主張直接使用視覺語言大模型(如 GPT-4V),將高級抽象指令分解為一系列低級可執行技能。

圖片

圖片

給定一條語言指令和當前的視覺觀測圖像,ViLa 利用 GPT-4V 通過鏈式思維推理來理解環境場景,隨后生成多步的計劃。接著,這個計劃的第一步由一個基本策略來執行。最后,已經執行的步驟被添加到已完成的計劃中,使得在動態環境中實現閉環規劃方法。

GPT-4V 由于經過大規模互聯網數據的訓練,展現出了卓越的多樣性和極強的泛化能力。這些特性使得它特別擅長處理論文中提出的開放世界場景。此外,作者團隊發現,即使是在零樣本(Zero-Shot)學習模式下運行,由 GPT-4V 驅動的 ViLa 也能夠解決多種具有挑戰性的規劃問題。這顯著減少了之前方法中所需的提示工程。

實驗

ViLa 在現實世界和模擬環境中都展示了以零樣本方式解決各種日常操作任務的能力,有效處理各種開放集指令和物體對象。作者團隊通過大量實驗證明了 ViLa 的優勢:1. ViLa 能深刻理解視覺世界中的常識,2. ViLa 支持靈活的多模態目標指定方法,3. ViLa 自然地支持視覺反饋和閉環控制。

A. ViLa 能深刻理解視覺世界中的常識

語言和圖像作為不同的信號類型,各具獨特性質:語言由人類生成,富含語義,但在表達全面信息方面有限;相比之下,圖像作為自然信號,包含細致的低層次特征,一張圖像便能夠捕捉場景的全部信息。在難以用語言簡單概括的復雜場景下,這種差異尤為突出。通過將視覺圖片直接結合到推理過程中,ViLa 可以理解視覺世界的常識知識,擅長處理需要全面了解空間布局或物體屬性的復雜任務。

空間布局

用簡單的語言描述復雜的空間布局,尤其是物體定位、位置關系和環境限制,是非常困難的。通過直接將視覺融入推理過程,ViLa 可以精確地識別物體在場景中的位置,以及它們之間的關系。

在 “拿可樂罐” 任務中,ViLa 發現可樂罐不在視線中,于是聰明地打開了冰箱并找到了它。而基線方法則會在可樂罐不在視線中的情況下給出” 拿起可樂罐 “的錯誤指令。

在 “拿空盤子” 任務中,ViLa 知道在拿起藍色盤子之前,需要先把它上面的蘋果和香蕉移走。而基線方法則忽視了盤子上的物體,直接給出” 拿起藍色盤子 “的錯誤指令。

物體屬性

物體的定義涵蓋多個屬性,包括形狀、顏色、材質、功能等。然而,自然語言的表達能力有限,因此在全面傳達這些屬性方面顯得笨拙。此外,物體的屬性與特定任務密切相關。以上原因使得過去的算法難以處理需要深入理解復雜物體屬性的場景。然而,得益于對視覺和語言的聯合推理,ViLa 對于物體在特定場景中的屬性有深入的理解。

在 “準備美術課” 任務中,ViLa 認為螺絲刀和水果刀是危險物品,于是移走了它們;考慮到桌上的剪紙,ViLa 認為剪刀對美術課是必要的物品,于是留下了它。而基線方法則忽視了桌上的剪紙和美術課這一特定場景,認為剪刀也是危險物品,選擇將其移走。

在 “挑選新鮮水果” 任務中,ViLa 可以精確地挑選出新鮮且完整的水果。而基線方法認為剝了一半的橘子和腐爛的香蕉都是完整且新鮮的水果。

作者團隊在 8 個相關任務上進行了充分的定量實驗。如表一所示,ViLa 在理解空間布局和物體屬性任務上顯著超過了基線方法。

圖片

B. 多模態目標指定

ViLa 支持靈活的多模態目標指定方法。ViLa 不僅能夠利用語言指令,還能夠利用多種形式的圖像作為目標,甚至利用語言和圖像的混合形式來定義目標。

視頻中的四個任務分別表明:

  1. ViLa 可以將真實圖片作為目標。
  2. ViLa 可以將抽象圖片(如小孩的畫,草稿等)作為目標。
  3. ViLa 可以將語言和圖像的混合形式作為目標。
  4. ViLa 可以發現圖片中手指指著的位置,并將其作為實際任務中的目標位置。

作者團隊在這四個任務上進行了定量實驗。如表二所示,ViLa 在所有任務中均表現出了強大的識別多模態目標的能力。

圖片

C. 視覺反饋

ViLa 以直觀、自然的方式有效利用視覺反饋,在動態環境中實現魯棒的閉環規劃。

  • 在 “堆木塊” 任務中,ViLa 檢測出了執行基本技能時的失敗,于是重新執行了一遍基本技能。
  • 在 “放薯片” 任務中,ViLa 意識到了執行過程中人的干擾。
  • 在 “找貓糧” 任務中,ViLa 可以不斷地打開抽屜 / 柜子來尋找貓糧,直到找到。
  • 此外,ViLa 可以完成需要人機交互的任務,等待人握住可樂罐之后才松開夾爪。

作者團隊在這四個任務上進行了定量實驗。如表三中所示,通過自然地結合視覺反饋,閉環控制的 ViLa 的表現顯著強于開環控制。

圖片

D. 模擬環境實驗

在模擬環境中,ViLa 可以按照高級語言指令的指示,將桌子上的物體重新組織成特定的排列。

如表四中所示,ViLa 在模擬環境中的表現也顯著超過了基線方法。

圖片

圖片

了解更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-03 08:43:55

機器人模型

2025-09-08 09:12:00

2023-10-19 09:32:45

自動駕駛技術

2024-02-06 09:00:00

GPT-4VLLaVA大型語言

2019-08-23 18:40:54

機器人人工智能

2024-07-23 09:48:59

2023-05-15 16:10:00

人工智能ChatGPT

2024-04-07 13:39:55

2025-06-06 08:52:00

機器人智能推理

2025-03-28 11:41:33

2023-10-12 13:05:00

谷歌AI

2020-10-19 08:32:04

AI機器人

2023-03-15 09:11:49

2015-05-22 11:40:00

希捷

2023-01-28 09:10:09

ChatGPTAI機器人

2024-03-01 13:20:58

機器人OpenAIGPT

2023-11-04 12:23:39

GPT-4AI

2023-10-16 09:23:24

自動駕駛技術

2023-11-13 18:19:35

AI訓練

2017-08-24 13:14:38

AI人工智能機器人
點贊
收藏

51CTO技術棧公眾號

亚洲资源在线网| www.精品在线| 欧美巨大xxxx| 成人动漫在线播放| 国产精品久久久久久久久动漫| 老牛影视免费一区二区| 亚洲人成免费网站| 91天堂在线观看| 久久日文中文字幕乱码| 国产精品高潮呻吟视频| 久久最新网址| 欧美中文字幕第一页| 我要色综合中文字幕| 北条麻妃一区二区三区中文字幕| 超碰在线最新网址| 欧美一级二级三级乱码| 国产激情视频在线观看| 91麻豆精品国产91久久久久| 午夜看片在线免费| 91精品国产综合久久精品app| 天堂а√在线官网| 精品国产伦一区二区三区观看体验 | 男女视频在线| 亚洲第一页中文字幕| 精品精品导航| 日韩精品在线视频| 视频一区在线免费看| 中文字幕精品一区久久久久| 日日夜夜综合| 91chinesevideo永久地址| 国产亚洲精品美女久久| 日本乱人伦a精品| 在线成人激情| 亚洲国产婷婷香蕉久久久久久99| 久久成人免费日本黄色| 免费毛片小视频| 一区二区三区四区不卡视频| 国产最顶级的黄色片在线免费观看| 精品美女久久久久久免费| 在线播放日本| 国产亚洲精品va在线观看| 日韩激情欧美| 国产精品一区二区三区成人| 亚洲承认在线| 欧美日韩中文字幕在线播放| 久久一区二区三区四区| 97香蕉久久| 欧美一区二区视频免费观看| 亚洲伦乱视频| 国产精品扒开腿做爽爽爽的视频| 欧美一区激情| 人人妻人人做人人爽| 一区二区激情小说| 成年人黄视频在线观看| 欧美巨大黑人极品精男| 欧美一区二区三区久久精品| 国产免费xxx| 一区二区三区欧美日韩| 羞羞的网站在线观看| 欧美精品做受xxx性少妇| 日韩欧美字幕| 男女激烈动态图| 亚洲福利视频一区| 麻豆免费版在线观看| 国产91精品久| 老司机精品视频导航| 五十度飞在线播放| 亚洲欧美日韩视频一区| 日韩dvd碟片| 高清欧美精品xxxxx| 狠狠色香婷婷久久亚洲精品| yw.尤物在线精品视频| caoporen国产精品| wwwwww.欧美系列| 麻豆最新免费在线视频| 97精品国产91久久久久久| 亚洲一区网站| 黄色春季福利在线看| 亚洲加勒比久久88色综合| 久久综合欧美| 亚洲 自拍 另类小说综合图区| 欧美伊人精品成人久久综合97 | 青娱乐自拍偷拍| 91国偷自产一区二区三区观看| 国产在线|日韩| 国产伦视频一区二区三区| 国产日产欧产精品推荐色| 成人影音在线| 91蜜桃网站免费观看| 国产精品免费久久| 999福利在线视频| 成人羞羞视频免费| 国产精品国产自产拍高清av| 一个人www视频在线免费观看| 亚洲iv一区二区三区| 亚洲国产精品高清| 亚洲承认视频| 欧美午夜欧美| 色狠狠综合天天综合综合| 国产精品一区二区三区美女| 黄色成人在线免费观看| 69久久99精品久久久久婷婷 | 久久99精品国产99久久6尤物| 欧美亚洲三级| 在线观看国产麻豆| 97av视频在线| 久久久精品中文字幕麻豆发布| 91超碰在线| 蜜桃臀一区二区三区| 欧美性xxxxxxxxx| 日韩av网址大全| 粉嫩虎白女毛片人体| 亚洲电影免费观看| 老鸭窝毛片一区二区三区| 国产一级片在线| 国产精品香蕉av| 亚洲精品国产一区二区三区四区在线 | 日本免费一区二区六区| 久久精品99| 欧美日韩午夜影院| 国产真实久久| 可以直接在线观看的av| 国产美女高潮久久白浆| 亚洲黄网站在线观看| 岳的好大精品一区二区三区| 99热.com| 国产成人97精品免费看片| 亚洲精品成人少妇| 黄色不卡一区| 亚洲国产资源| 国产精品久久久久av福利动漫| 色综合天天综合网天天看片 | 国产精品尤物福利片在线观看| 亚洲美女少妇撒尿| 欧美有码在线| 国产国产人免费人成免费视频| 国模gogo一区二区大胆私拍| 中文字幕的久久| 欧美色图婷婷| 日本按摩中出| 91免费国产网站| 欧美日韩精品福利| 免费av网站大全久久| 奇米777日韩| 日本999视频| 国产精品久久久久久久av电影| 懂色av影视一区二区三区| 国内在线观看一区二区三区| 成年人网站在线| 青青青青在线视频| 欧美激情小视频| 伊人开心综合网| 欧美视频在线观看| 任你弄在线视频免费观看| 中文字幕乱码一区二区三区| 色婷婷av一区二区三区在线观看| 国产欧美日韩卡一| 91精品亚洲| 一色桃子av在线| 自拍偷拍视频在线| 美女久久久久久久久久久| 亚洲精品免费一二三区| 欧美破处大片在线视频| 国产后进白嫩翘臀在线观看视频| 精品一区二区三区无码视频| 欧美日韩国产二区| 欧美日韩国产麻豆| 久久国产精品99久久久久久老狼 | 欧美第一页浮力影院| 国产精品久久精品| 日韩丝袜情趣美女图片| 不卡的看片网站| 国产日韩欧美一区二区三区| 欧美女同网站| 国产免费xxx| 国产成人一区二区| 日韩精品在线看片z| 91啪亚洲精品| 欧美精品91| 欧美国产中文高清| av福利在线播放| 美女日批免费视频| 亚洲自拍偷拍网址| 国产午夜精品一区二区三区| 亚洲电影中文字幕在线观看| 蜜臀av一级做a爰片久久| 老司机精品在线| 在线观看h网| 日本在线аv| 国产制服91一区二区三区制服| 青青a在线精品免费观看| 日韩精品一区二区在线| 亚洲欧洲三级电影| 蜜臀av一区二区在线观看| 欧美精品一区二区久久| 欧美色999| 国产高清在线观看| 羞羞小视频视频| 精品一二三四五区| 欧美精品欧美精品|