国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

歐幾里得的禮物:通過幾何代理任務增強視覺-語言模型中的空間感知和推理能力

人工智能 新聞
來自華中科技大學、北京中關村學院和華東師范大學的研究團隊將目光轉向從更廣泛且更基礎的空間現象中學習,從而突破單一數據集的局限,擴展模型的能力范圍。

本文共同第一作者為華中科技大學博士生連仕杰與華東師范大學博士生鄔長倜,二者同時也是北京中關村學院2024級學生。共同通訊作者包括:鄭州大學學術副校長,鄭州大學/華中科技大學教授,加拿大工程院/歐洲科學院院士楊天若教授;北京中關村學院&中關村人工智能研究院具身方向負責人陳凱。

近年來,多模態大語言模型(MLLMs)在廣泛的視覺-語言任務中取得了顯著成功。盡管如此,最先進的 MLLMs 仍然缺乏真正的空間智能。甚至如今,最先進的視覺-語言模型(VLMs)在一些兒童輕易就能完成的任務上仍會出現偶爾錯誤,例如數方塊或識別給定物體左側最近的鄰近物體。

圖 1,讓 GPT5-Thinking 和 Gemini 2.5 Pro 數方塊(正確答案是白色 10 塊,橙色 13 塊)

在李飛飛提出的 VSIBench 評估基準中顯示,超過 70% 的記錄錯誤源于模型對空間現象的推理錯誤,而非視覺識別或語言解析能力的不足。這一現象與著名的「莫拉維克悖論」一致,即對于 VLM 而言,有可能高層次推理任務在計算上比低層次的感知和感覺運動技能更簡單。

近期如 Spatial-MLLM、SpaceVLM、RoboBrain2.0 等關于空間感知 VLM 的研究,嘗試通過提供專門構建的空間數據集來提升模型性能。然而,這些空間數據集中的任務通常僅涵蓋現實世界空間任務的一個子集,可能無法增強模型的整體空間智能。這凸顯了實現空間智能的一個關鍵挑戰:

盡管在特定空間任務數據集上進行微調可以實現高模型域內的性能,但可能導致模型過度特化,難以培養更基礎且可泛化的空間智能。

為了打破這一僵局,來自華中科技大學、北京中關村學院和華東師范大學的研究團隊將目光轉向從更廣泛且更基礎的空間現象中學習,從而突破單一數據集的局限,擴展模型的能力范圍。

  • 論文標題:Euclid’s Gift: Enhancing Spatial Perception and Reasoning in Vision-Language Models via Geometric Surrogate Tasks 
  • 論文地址:https://zgca-ai4edu.github.io/Euclids_Gift/

具體來說,為了培養模型在任何單一基準之外發展泛化的空間能力,他們嘗試探索一種新穎的訓練范式,將解決幾何問題作為在 VLMs 中提升空間智能的代理任務。

幾何將數個世紀的數學研究濃縮為對空間現象的形式化描述。因此,學習求解平面與立體幾何問題迫使模型內化歐幾里得幾何公理等先驗知識,并為模型提供更強的跨領域泛化能力,因為這些原理具有普適性且獨立于任何單一任務。

為什么選擇「幾何問題」作為空間智能的代理任務?

實際上,解決幾何問題所需的能力,包括識別形狀與構型、推斷空間關系(如平行、角度和相對位置)、計算或測量幾何元素,以及執行多步邏輯推理,同樣也是空間感知任務所必需的。

此外,教育心理學領域有大量現存證據表明,幾何問題求解與空間智力密切相關,可以作為空間能力的有力指標,并且可以通過有針對性的練習加以提升 [1] [2] [3]。 本文通過大量實驗進一步發現,這種關系不僅適用于人類學習者,也可推廣至多模態大模型。

制作更豐富的、以幾何為中心的訓練集

遺憾的是,目前尚無針對多樣化幾何問題的大規模高質量訓練數據集。此外,現存數據集中顯著的不平衡性:立體幾何題遠少于平面幾何題。然而,立體幾何包含了更多明確的三維空間現象(例如視角不變性、多面體截斷特征、體積與面積關系等),這些對 VLM 學習空間知識同樣至關重要。

為此,本文從現有開源數據集與 K12 階段的教程/練習冊中重新收集數據,標注了一個具有 29,695 個幾何問題的幾何數據集——Euclid30K。Euclid30K 中的所有題目與答案都通過 GPT-4o 與 DeepSeek-V3.1 API 的混合清洗,以確保答案被重規范化為可以被 MathVerify 正確識別的格式。

驗證

為了讓訓練得到的性能收益全部來自于幾何數據集,而非精心設計的算法或其他 trick。本文只使用了常規的 GRPO 對模型進行訓練。并參考 DAPO 使用了 0.28 的 CLIP 裁剪上界、Token-level 策略梯度損失以及動態采樣。

結果顯示,經過幾何問題訓練后,模型在 VSI Bench、Super CLEVR、Omni3D Bench 和 MindCube 這四個基準上的性能都出現了一定程度的增長。體現了使用幾何問題作為代理任務這空間智能上的 zero-shot 泛化能力。

為了進一步確保模型的性能提升來自于可以明確歸因于幾何任務作為空間智能的有效代理任務,而非 GRPO 算法或數據量增加的影響。本文進行了一項因果消融研究。

具體而言,本文在非幾何的空間智能數據集 Clevr-CoGenT 上隨機采樣了一個與 Euclid30K 大小相等的樣本,并使用完全相同的 GRPO 設置來訓練 Qwen2.5VL 和 RoboBrain2.0。結果表明,在 Euclid30K 上訓練的模型相比在同等大小的 Clevr-CoGenT 數據集上微調的模型,整體準確率顯著更高。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-01-27 12:03:11

2025-11-27 09:02:00

2023-12-04 13:40:09

AI訓練

2024-02-19 07:10:00

視覺模型

2024-04-11 11:35:03

大語言模型LLMs

2024-08-27 09:35:47

2023-05-05 13:29:04

模型推理

2023-01-05 09:33:37

視覺模型訓練

2025-07-10 09:14:11

2024-07-02 12:27:47

2025-05-29 02:11:00

2025-06-10 03:30:00

2023-11-15 14:17:23

微軟語言模型AI 模型

2023-07-09 15:09:18

機器學習能力

2024-06-20 14:12:53

2024-07-01 12:54:39

2025-02-25 09:49:12

2025-05-08 02:02:02

2023-11-20 22:14:16

計算機視覺人工智能

2023-04-27 13:46:08

語言模型ChatGPT人工智能
點贊
收藏

51CTO技術棧公眾號

国产美女视频一区| 69免费视频| 国产成人精品久久二区二区91| 日韩经典第一页| 亚洲wwwav| 亚洲已满18点击进入在线看片| 国产高清免费在线| 人成在线免费视频| 国产一级片在线播放| 秋霞蜜臀av久久电影网免费| 91亚洲资源网| 在线观看视频免费| 欧美三区美女| 国产成人啪精品视频免费网| 久久久久久久性潮| 亚洲欧美中文日韩在线v日本| 污的网站在线观看| 亚洲精品456在线播放狼人| 超碰在线caoporn| 欧美精品在线视频| eeuss影院www在线播放| 在线观看一区二区精品视频| 国产区av在线| 欧美色视频在线| 992tv免费直播在线观看| 黑人巨大精品欧美一区二区免费| 波多野结衣在线| 五月婷婷欧美视频| 在线的色视频| 欧美日韩在线亚洲一区蜜芽| 色综合久久综合网97色综合| 国产精品久久久久一区二区| 免费观看成人在线视频| 乱人伦中文视频在线| 欧美黄色免费| 美女扒开尿口让男人操亚洲视频网站| 992tv在线影院| 麻豆视频一区| 在线日韩中文| 国产精品国产三级国产aⅴ入口 | 视频一区国产精品| 亚洲久久一区| 日韩高清av| 成人毛片视频在线观看| 大j8黑人w巨大888a片| 亚洲视频一区二区在线观看| 日韩私人影院| 亚洲国内精品视频| 亚洲日本一区二区三区在线| 亚洲一区二区少妇| 国产在线精品一区二区| 天堂网在线免费观看| 婷婷六月综合网| 捆绑调教日本一区二区三区| 欧美精品videossex性护士| 久久一区二区三区电影| 日本在线观看一区| www精品美女久久久tv| 在线播放的av| 亚洲欧美成人网| 亚洲小说图片视频| 日本在线视频不卡| 亚洲欧美综合网| 最新日本在线观看| 97久久精品视频| 蜜乳av另类精品一区二区| 91视频最新入口| 欧美日韩美女在线| 欧美黄色网络| 国产精品一区二区三区四区五区 | 国产精品白丝av嫩草影院| 国产免费观看久久黄| 久久精品国产一区二区| 成人免费淫片95视频观看网站| 4438x成人网最大色成网站| 视频一区中文字幕精品| 蜜桃麻豆91| 亚洲色图制服诱惑| heyzo中文字幕在线| 青草青草久热精品视频在线网站| 新67194成人永久网站| www.久久久精品| 亚洲精品成人网| 亚洲v在线看| 激情五月亚洲色图| 亚洲国产欧美一区二区三区同亚洲| 欧美日韩一区二区综合| 精品丰满人妻无套内射| 欧美日韩一区二区欧美激情 | 国产一区导航| 国产天堂av| 国产午夜精品视频| 亚洲片区在线| av天在线播放| 色小说视频一区| 久久久久在线| 自拍偷拍第1页| 久久躁狠狠躁夜夜爽| 青椒成人免费视频| 国产福利第一视频在线播放| 18一19gay欧美视频网站| 国产精品一区二区三区网站| 香蕉视频在线播放| 91精品在线一区| 亚洲精品乱码久久久久久黑人| 亚洲伊人精品酒店| 日本一道在线观看| 欧美mv日韩mv亚洲| 亚洲欧洲另类| 二区在线观看| 91社区国产高清| 亚洲一区二区三区四区在线| 爱爱精品视频| 精品久久久久久无码国产| 影音先锋日韩有码| 国精产品一区一区三区mba桃花| 麻豆视频在线免费观看| 成人女人免费毛片| 色欧美片视频在线观看| 亚洲成人精选| 十九岁完整版在线观看好看云免费| 国产一二三四五| 日韩三级电影免费观看| 精品在线播放午夜| 天堂中文在线资| 999视频在线免费观看| 精品久久久网站| 欧美高清一区二区| 亚洲mv在线观看| 日本伊人久久| 欧美中文字幕在线观看视频| 在线播放中文一区| 欧美人成网站| 青青草超碰在线| 国产欧美亚洲精品| 亚洲午夜久久久久久久久久久| 久久久精品国产**网站| 妞干网在线观看视频| 一区二区在线视频播放| 国产精品18久久久久久久网站| 亚洲黄色免费av| 99er在线视频| 亚洲天堂av在线播放| 丁香亚洲综合激情啪啪综合| 色老太综合网| 男插女免费视频| 亚洲天堂av在线免费| 成人黄色a**站在线观看| 欧美xxxhd| 欧美中文字幕在线观看视频| 尤物九九久久国产精品的分类| kk眼镜猥琐国模调教系列一区二区 | 国产精品va在线观看无码| 亚洲精品电影网在线观看| 国产乱码一区二区三区| 亚洲成人1区| sm一区二区三区| 99三级在线| 精品福利在线导航| 99精品偷自拍| 国产成人短视频在线观看| 国产视频二区在线观看| 日韩精品一线二线三线| www.久久色.com| 一区二区三区中文字幕电影| 久久美女视频| 欧美巨大xxxx做受沙滩| 亚洲精品无码久久久久久| 欧洲精品久久久| 亚洲午夜精品网| 首页国产欧美日韩丝袜| 日韩影片中文字幕| av777777| 免费国产一区二区| 久久精品国产欧美亚洲人人爽| 亚洲五码中文字幕| 日韩高清不卡一区二区| 蜜桃在线一区| 国产原创av在线| 加勒比海盗1在线观看免费国语版| 欧美精品久久久久a| 欧洲一区二区三区在线| 国产精品一区在线| 久久美女视频| 国产欧洲在线| 日本全棵写真视频在线观看| 久久国产精品 国产精品| 日韩中文字幕免费看| 狠狠做深爱婷婷久久综合一区| 免费精品视频在线| 欧美人与牛zoz0性行为| 中文av资源在线| 自拍偷拍 国产| 久久精精品视频| 欧美肥婆姓交大片| 欧美日韩国产片| 国产午夜精品理论片a级大结局 | 欧美精品一区二区三区久久久竹菊| 在线播放高清视频www| 日本调教视频在线观看|