国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

李飛飛「空間智能」之后,上交、智源、北大等提出空間大模型SpatialBot

人工智能 新聞
來自上交、斯坦福、智源、北大、牛津、東大的研究者提出了空間大模型 SpatialBot,并提出了訓練數據 SpatialQA 和測試榜單 SpatialBench, 嘗試讓多模態(tài)大模型在通用場景和具身場景下理解深度、理解空間。

本文第一作者為斯坦福大學研究生蔡聞驍,此前,他以績點第一名的成績在東南大學取得學士學位。他的研究興趣為多模態(tài)大模型、具身智能。此工作為其在上海交通大學訪問和北京智源人工智能研究院實習期間完成,導師為本文通訊作者趙波教授。

此前,李飛飛老師提出了空間智能 (Spatial Intelligence) 這一概念,作為回應,來自上交、斯坦福、智源、北大、牛津、東大的研究者提出了空間大模型 SpatialBot,并提出了訓練數據 SpatialQA 和測試榜單 SpatialBench, 嘗試讓多模態(tài)大模型在通用場景和具身場景下理解深度、理解空間。

圖片

  • 論文標題: SpatialBot: Precise Depth Understanding with Vision Language Models
  • 論文鏈接: https://arxiv.org/abs/2406.13642
  • 項目主頁: https://github.com/BAAI-DCAI/SpatialBot

在具身智能的 pick and place 任務中,需要判斷機械爪是否碰到了目標物體。如果碰到,則可以合上爪子抓取。然而,在這個 Berkerly UR5 Demonstration Dataset 場景中,即使是 GPT-4o 或人類,都無法從單張 RGB 圖像中判斷機械爪是否碰到了目標物體,比如借助深度信息,將深度圖直接給 GPT-4o 看的話,也無法判斷,因為它不能理解深度圖。

SpatialBot 通過對 RGB-Depth 的理解,可以準確獲得機械爪和目標物體的深度值,從而產生對空間概念的理解。

圖片

具身場景的 SpatialBot Demo:

1. 以人 (相機) 的視角,抓取右側的茶杯

2. 抓取最中間的茶杯

作為走向具身智能的必要路徑,如何讓大模型理解空間?

點云比較貴,雙目相機在使用中需要經常校準。相比之下,深度相機價格可以接受、使用范圍廣。在通用場景中,即使沒有這樣的硬件設備,大規(guī)模無監(jiān)督訓練過的深度估計模型已經可以提供較為準確的深度信息。因此,作者提出,使用 RGBD 作為空間大模型的輸入。

目前的技術路線存在什么問題?

  1. 現有模型無法直接理解深度圖輸入。比如,圖像編碼器 CLIP/SigLIP 在 RGB 圖像上訓練,沒有見過深度圖。
  2. 現有大模型數據集,大多僅用 RGB 就可以分析、回答。因此,如果僅僅簡單的將現有數據改為 RGBD 輸入,模型不會主動到深度圖中索引知識。需要專門設計任務和 QA,引導模型理解深度圖、使用深度信息。

三個層次的 SpatialQA,逐步引導模型理解深度圖、使用深度信息

如何引導模型理解和使用深度信息,理解空間?

作者提出具有三個層次的 SpatialQA 數據集。

  1. 在 low level 引導模型理解深度圖,引導從深度圖直接獲取信息;
  2. 在 middle level 讓模型將 depth 與 RGB 對齊;
  3. 在 high level 設計多個深度相關任務,標注了 50k 的數據,讓模型在理解深度圖的基礎上,使用深度信息完成任務。任務包括:空間位置關系,物體大小,物體接觸與否,機器人場景理解等。

示例對話

SpatialBot 包含什么?

1. 借鑒 agent 中的思想,SpatialBot 在需要時,可以通過 API 獲取準確的深度信息。在深度信息獲取、遠近關系比較的任務上,可以達到 99%+ 的準確率。

2. 針對空間理解任務,作者公布了 SpatialBench 榜單。通過精心設計和標注 QA,測試模型深度理解能力。SpatialBot 在榜單上展示了和 GPT-4o 接近的能力。

模型如何理解深度圖?

1. 輸入模型的深度圖:為了兼顧室內室外任務,需要統一的深度圖編碼方式。室內的抓取、導航任務可能需要毫米級的精確度,室外的場景不需要這么精準,卻可能需要 100 米以上的深度值范圍。傳統視覺任務中會用 Ordinal Encoding 來編碼,但是 ordinal 的值無法進行加減運算。為了盡可能保留所有深度信息,SpatialBot 直接使用以毫米為單位的 metric depth,范圍為 1mm~131m,使用 uint24 或三通道的 uint8 來保留這些值。

2. 為了精準的獲取深度信息,借鑒 agents 中的思想,SpatialBot 在認為有必要的時候,會以點的形式調用 DepthAPI,獲取準確的深度值。若想獲取物體的深度,SpatialBot 會先思考物體的 bounding box 是什么,然后用 bounding box 的中心點調用 API。

3. SpatialBot 使用物體的中心點、深度平均、最大和最小四個值來描述深度。

SpatialBot 和 DepthAPI 架構

SpatialBot 在通用場景和具身場景效果如何?

1. SpatialBot 基于 3B 到 8B 的多個 base LLM。通過在 SpatialQA 中學習空間知識,SpatialBot 在常用 MLLM 數據集 (MME、MMBench 等) 上同樣展示了顯著的效果提升。

2. 在 Open X-Embodiment、作者收集的機器人抓取數據等具身任務上,SpatialBot 同樣展示了驚人效果。

圖片

SpatialBot 通用場景對比實驗

數據如何標注?

精心設計了關于空間理解的問題,比如深度、遠近關系、上下左右前后位置關系、大小關系,并且包含了具身中的重要問題,比如兩個物體是否接觸。

在測試集 SpatialBench 中,首先人工思考問題、選項和答案。為了擴大測試集大小,也使用 GPT 以同樣的流程標注。

訓練集 SpatialQA 包含三方面: 

  1. 直接理解深度圖,讓模型看深度圖,分析深度的分布,猜測其中可能包含的物體; 
  2. 空間關系理解和推理;
  3. 機器人場景理解:描述 Open X-Embodiment 和本文收集的機器人數據中的場景、包含的物體、可能的任務,并人工標注物體、機器人的 bounding box。

空間關系理解

圖片

Open X-Embodiment 機器人場景理解

圖片

深度圖理解。在使用 GPT 標注這部分數據時,GPT 會先看到深度圖,描述深度圖、推理其中可能包含的場景和物體,然后看到 RGB 圖,篩選出正確的描述和推理。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-13 14:20:00

AI模型訓練

2024-09-23 15:20:00

2024-11-11 08:30:00

2024-09-03 14:30:00

機器人模型

2024-12-23 13:50:00

數據訓練模型

2023-11-07 11:50:14

AI訓練

2025-07-02 18:15:02

李飛飛AGI智能

2021-02-07 10:01:31

AI 數據人工智能

2025-11-26 00:00:00

2024-12-23 12:37:34

2024-05-06 07:10:00

李飛飛智能空間

2025-11-13 09:02:54

2024-12-05 09:53:18

智能體AI

2025-11-11 09:40:51

2024-05-16 12:44:30

模型訓練

2024-05-21 12:23:00

模型訓練

2025-11-11 13:49:05

2025-09-17 09:18:56

2024-12-19 13:30:00

2024-12-19 15:08:58

點贊
收藏

51CTO技術棧公眾號

国产伦精品一区二区三区四区视频| 久久黄色av网站| 天堂影视av| 亚洲精品不卡在线观看| 免费看黄在线看| 久久av一区二区| 精品视频一区二区三区四区五区| 狠狠狠色丁香婷婷综合激情| 亚洲精品在线观看网站| 国产 福利 在线| 色婷婷亚洲mv天堂mv在影片| 欧美va亚洲va在线观看蝴蝶网| 亚洲一区二区三区乱码| 秋霞影院一区二区三区| 国产精品人人爽人人做我的可爱| 美国毛片一区二区三区| 日韩视频免费在线观看| 国产偷激情在线| 国产麻豆精品久久一二三| 亚洲一区亚洲二区亚洲三区| 91在线直播| 国产精品国产自产拍高清av| 欧美第一黄网| 91蜜桃在线观看| 春暖花开成人亚洲区| 奇米一区二区三区| 欧美日韩国产精品一区二区不卡中文| 欧美精品一区二区三区免费播放| 国产亚洲欧美一区在线观看| 波多野结衣中文字幕在线| 欧美日韩国产美女| 日韩大尺度黄色| 国产精品扒开腿做| 免费观看成人鲁鲁鲁鲁鲁视频| 337p粉嫩大胆噜噜噜鲁| 欧美日韩一区二区三区| 国产精品极品美女在线观看| 欧美中文在线字幕| 美国一区二区三区在线播放| 偷拍视频一区二区| 日韩国产欧美在线视频| 国产精品视频专区| 国产免费成人| 欧美视频1区| av免费在线一区| 欧美三级日韩在线| 欧美日韩一区在线播放| 国产在线视频你懂得| 国内精品久久久久久久久电影网| 国产日本欧美一区二区| 国产情人综合久久777777| 久久精品91久久久久久再现| 在线综合视频网站| 老司机免费视频一区二区三区| 欧美极品一区二区| 日本视频在线一区| 日韩video| 日韩免费va| 97视频一区| 久久99国产综合精品女同| 国产美女久久| 欧美激情视频网址| 亚洲制服一区| 成人免费网视频| 制服诱惑一区二区| 中文字幕制服丝袜在线| eeuss鲁片一区二区三区在线观看| 国产精品69页| 九九热hot精品视频在线播放| 欧美激情亚洲自拍| 欧美猛男同性videos| 91九色视频导航| 欧美精品九九| 亚洲国产一区在线| 久久视频一区二区| 伊人色综合久久| 91精品国产欧美一区二区18| 国产精选在线| 欧美肥婆姓交大片| 小小影院久久| 青青草视频国产| 亚洲精品少妇30p| 国产在线观看免费麻豆| 日韩在线视频免费观看高清中文 | 久久av一区二区| 久久99国产精品免费| 欧美精品成人网| 色综合视频一区二区三区高清| 四虎亚洲成人| 久久久久久久久久久人体| 国内精品久久久久久久影视麻豆| 伊人久久大香线蕉精品| 欧美国产成人在线| 成人免费高清在线播放| 中文字幕成人精品久久不卡| 日韩情爱电影在线观看| 一本色道久久综合亚洲精品婷婷| 色偷偷免费视频| 精品一区二区三区免费视频| 少妇网站在线观看| 91精品国产色综合久久ai换脸 | 激情欧美一区二区三区在线观看| 成人eeuss影院在线观看| 欧美剧情电影在线观看完整版免费励志电影| 亚洲电影观看| 国产美女精品视频| 成人夜色视频网站在线观看| 欧美日韩激情视频一区二区三区| 亚洲男人天堂古典| 欧美激情1区2区3区| 日本www在线播放| 欧美剧情电影在线观看完整版免费励志电影 | 欧美一区二区三区影视| 久久久久久亚洲精品美女| 国产专区一区二区三区| 中文字幕国产一区| 蜜桃麻豆av在线| 99re资源| 亚洲视频一区二区在线| 91在线亚洲| 色姑娘综合网| 一本一本久久a久久精品综合麻豆| 精品国产不卡一区二区| 午夜精品一区二区在线观看的 | 美女国产精品久久久| 欧美亚洲精品日韩| 亚洲国产aⅴ天堂久久| 色999久久久精品人人澡69| 日韩av电影免费观看| 色屁屁一区二区| 成人免费电影网址| 亚洲激情在线观看视频| 亚洲新声在线观看| 日韩国产欧美在线播放| 国产精品亚洲a| 91久久大香伊蕉在人线| 懂色av一区二区| 亚洲人久久久| 777色狠狠一区二区三区| 日韩片欧美片| 免费看av大片| 欧美激情国产日韩精品一区18| 精品一区二区精品| 污污视频在线| 久久久综合亚洲91久久98| 福利一区福利二区微拍刺激| 台湾佬综合网| 最新国产乱人伦偷精品免费网站| www.久草| 欧美在线视频在线播放完整版免费观看| 成人综合婷婷国产精品久久 | 欧美成人网在线| 国产成人精品三级麻豆| 一个人www视频在线免费观看| 日本日本精品二区免费| 91福利国产精品| 狠狠色丁香久久综合频道| 小草在线视频在线免费视频| 国产精品com| 亚洲国产日日夜夜| 久久久久久久久久久9不雅视频| 欧美激情图区| 97伦理在线四区| 欧美日韩成人综合天天影院| 亚洲高清成人| av网站免费在线观看| 亚洲一卡二卡三卡四卡无卡网站在线看| 精品国产乱子伦一区| 久久99精品国产麻豆不卡| 奇米777日韩| 亚洲熟女乱色一区二区三区| 欧美极品xxxx| 亚洲精品videosex极品| 三上亚洲一区二区| 日本在线www| 公共露出暴露狂另类av| 日韩中文字幕国产| 中文在线一区二区| 成人精品视频| 国产一二区在线| 国产欧美精品aaaaaa片| 久久久天堂国产精品女人| 亚洲国产视频一区二区| 永久亚洲成a人片777777| a级片国产精品自在拍在线播放| 中文字幕中文字幕在线中一区高清| 亚洲视频视频在线| 国产精品三级视频| 亚洲一区二区三区| 中文在线免费二区三区| 男女无套免费视频网站动漫| 国产精品三级久久久久久电影| 色噜噜狠狠色综合欧洲selulu| 久久天堂精品| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 成人精品电影在线| 91p在线观看| 欧美日韩国产高清视频| 日韩视频亚洲视频| 疯狂做受xxxx欧美肥白少妇|