国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

首創像素空間推理,7B模型領先GPT-4o,讓VLM能像人類一樣「眼腦并用」

人工智能 新聞
來自滑鐵盧大學、港科大、中科大的研究團隊,首次將推理戰場從文本空間拓展到像素空間,提出「像素空間推理」(Pixel-Space Reasoning)范式。

視覺語言模型(VLM)正經歷從「感知」到「認知」的關鍵躍遷。

當OpenAI的o3系列通過「圖像思維」(Thinking with Images)讓模型學會縮放、標記視覺區域時,我們看到了多模態交互的全新可能。

然而,當前主流VLM仍被困在「文本繭房」中——依賴文本token間接翻譯視覺信息,在高清圖像中的微小物體、視頻里的動態細節等場景中,常常因缺乏直接視覺操作能力而「視而不見」。

來自滑鐵盧大學、港科大、中科大的研究團隊,首次將推理戰場從文本空間拓展到像素空間,提出「像素空間推理」(Pixel-Space Reasoning)范式。

這項突破讓VLM能像人類一樣「眼腦并用」:通過原生視覺操作直接與視覺信息對話,在像素級精度上解鎖視覺理解的新維度。

圖片

推理模式重構:從「文本中介」到「視覺原生」

傳統VLM如同帶著「文本濾鏡」看世界:將圖像翻譯成文本token再推理,導致小字體、隱蔽物體等關鍵信息在轉換中丟失。而「像素空間推理」賦予模型「視覺手術刀」般的能力

  • 視覺主動操作:模型可自主觸發視覺變焦(放大關鍵區域)、時空標記(定位視頻動態線索)等原生操作,在像素矩陣上直接完成「操作 - 分析 - 推斷」的閉環推理,避免了文本轉譯導致的信息衰減。
  • 視覺主導推理:視覺操作成為推理演進的核心驅動力。例如圖例中,回答「咖啡杯 logo 品牌」時,模型先通過空間先驗定位桌面區域,再通過視覺放大逐行掃描杯身,最終在像素級精度上提取 logo 特征。這種「視覺線索引導推理」的機制,使模型能捕捉傳統方法難以處理的空間關系與動態細節,尤其在具身視覺導航、復雜視頻理解等場景中展現出顯著優勢。

圖片

這種「眼腦協同」的推理模式,打破了文本對視覺語義的「翻譯牢籠」,讓模型真正具備了與人類視覺認知同構的推理能力。

學習陷阱破解:好奇心激勵突破認知惰性困局

在能力遷移過程中,研究團隊發現指令微調模型仍面臨「認知惰性」帶來的嚴峻挑戰:成熟的文本推理能力與稚嫩的像素操作能力形成能力鴻溝,導致模型陷入「學習陷阱」:

1 負面反饋循環:初期視覺操作的低成功率引發大量負向信號,抑制模型使用新能力的意愿;

2 路徑依賴慣性:簡單任務中模型更傾向調用已掌握的文本推理,形成「新能力退化」的惡性循環。

如同熟練的滑雪者初次嘗試沖浪,初期的失衡體驗會讓人本能回歸熟悉領域,而忽視新技能的長期價值。

為打破這一困境,研究團隊設計了內在好奇心激勵配合外在正確性激勵的強化學習獎懲方案。通過引入內在激勵鼓勵模型練習視覺操作,并引導模型逐步挖掘「像素空間推理」的潛在價值,而非僅依賴外在的正確性獎勵。這就像幼兒學步時,對新鮮動作的內在好奇會驅動其反復嘗試,即使每次嘗試都伴隨著跌倒。因此,研究團隊形式化出下面的約束優化目標

圖片

其中包含兩個關鍵約束用于有效激發「像素空間推理」

  • 像素推理率約束(RaPR):要求模型至少以特定比率觸發像素空間推理,克服認知惰性;
  • 操作效率約束:限制單次推理的視覺操作次數,在探索與計算成本間找到平衡。

通過拉格朗日松弛等效轉化為以下的獎勵函數:

圖片

其中的內在好奇心激勵(r_curiosity)會在模型低頻觸發「像素空間推理」時提供內在激勵,如同為探索未知領域的冒險者提供「勇氣加成」,降低嘗試新能力的機會成本。同時,隨著訓練推進,好奇心獎勵會動態衰減,確保模型最終聚焦于推理效率而非獎勵投機,形成「好奇驅動」到「效用驅動」的良性過渡。

圖片

性能驗證:7B 模型實現高效能突破

在四大視覺推理基準測試中,基于Qwen2.5-VL-7B構建的Pixel-Reasoner展現出碾壓級表現:

  • V* Bench(高清圖像推理):84.3%準確率,超越GPT-4o(62.8%)和Gemini-2.5-Pro(79.2%)。
  • TallyQA-Complex(復雜場景計數):73.8%準確率,較基線模型提升5.1%,能精準區分圖像中相似物體的數量差異。
  • InfographicsVQA(信息圖表理解):84.0%準確率,在混合文本與圖表的復雜場景中,推理準確率達到Gemini-2.5-Pro水平。
  • MVBench(長視頻推理):67.8%準確率,通過像素空間的時空操作捕捉視頻中的關鍵視覺線索,時序推理能力領先GPT-4o 3.2%。

圖片

值得注意的是,僅7B參數的Pixel-Reasoner,性能全面超越27B的Gemma3等開源模型,甚至媲美部分閉源商業模型,展現出「小模型大能力」的高效特性。

此外,研究團隊也進行了細節的實驗來分析模型「認知惰性」帶來學習新推理能力的「學習陷阱」,為如何有效培養模型全新推理能力提供了深刻的啟示。

圖片

研究團隊指出,像素空間推理并非對文本推理的替代,而是為VLM開啟了「第二思維通道」。當視覺與語言雙軌并行,多模態模型才能真正理解世界的復雜性。

Pixel-Reasoner尚且是多模態推理范式的初步探索。從「看山是山」到「見微知著」,隨著多模態推理能力的進一步發展,我們正迎來一個機器能「看得更細、想得更深」的智能時代。

論文地址:https://arxiv.org/pdf/2505.15966
項目主頁:https://tiger-ai-lab.github.io/Pixel-Reasoner/
模型試玩:https://huggingface.co/spaces/TIGER-Lab/Pixel-Reasoner

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-04 08:42:27

2025-07-14 09:00:00

2025-08-14 10:25:11

2025-09-24 08:53:10

2025-01-06 12:46:16

模型數據訓練

2024-06-11 14:30:18

2025-10-24 12:07:12

2025-04-11 09:10:00

模型開源AI

2025-12-03 17:17:29

AI圖像生成模型

2025-04-16 15:28:31

模型AI數據

2024-12-26 07:10:00

2025-05-30 09:10:00

2024-05-21 12:23:17

2025-10-13 07:58:56

2024-09-29 13:07:16

2025-06-06 14:17:11

模型訓練AI

2023-05-30 13:29:25

2024-07-23 09:26:20

2025-02-27 13:45:00

2023-09-22 11:56:57

模型駕駛
點贊
收藏

51CTO技術棧公眾號

极品美鲍一区| 国产剧情一区| 国产欧美精品在线观看| 操一操视频一区| 黄频免费在线观看| 精品欧美国产一区二区三区| 尤物av无码色av无码| 亚洲制服av| 国产精品美女主播| 在线欧美激情| 日韩精品在线电影| 国产女人在线观看| 亚洲特级片在线| 日韩日韩日韩日韩日韩| 久久激情综合| 99www免费人成精品| 久久久久97| 亚洲视频axxx| а√天堂在线官网| 欧美亚洲国产bt| 色视频在线播放| 国产精品―色哟哟| 欧美日韩国产精品激情在线播放| 日本视频在线一区| 精品国产一区二区三区麻豆小说 | 成人福利网站在线观看| 电影一区中文字幕| 亚洲免费成人av电影| 国产精品刘玥久久一区| 黑人精品xxx一区一二区| 成年人福利视频| 亚洲国产精品国自产拍av| 国产自产在线视频| 黄页网站大全一区二区| 日韩精品欧美专区| 日日欢夜夜爽一区| 欧美精品久久久| 亚洲欧美bt| 日本一区二区三区www| 亚洲激情av| 久久99精品久久久久久秒播放器 | 91黑丝高跟在线| 国产在线视频欧美一区| 亚洲色图五月天| 九色porny自拍视频在线观看| 91精品国产综合久久久久久 | 国产成人免费高清| 亚洲精品视频一区二区三区| 国产精品日韩久久久| 国产伦精品一区二区三区照片 | a免费在线观看| 日韩一级大片在线| 久草在线资源站资源站| 欧美本精品男人aⅴ天堂| 波多野在线观看| 亚洲精品98久久久久久中文字幕| 日本高清在线观看视频| 亚洲精品一线二线三线无人区| 成人区精品一区二区不卡| 日韩欧美自拍偷拍| 一区二区三区四区日本视频| 中文日韩在线观看| 盗摄牛牛av影视一区二区| 日本中文字幕不卡免费| 亚洲破处大片| 色999五月色| 99久久精品免费观看| 99re6在线视频| 欧美性20hd另类| 欧美videos另类精品| 国产一区二区精品丝袜| 999在线精品| 成人久久18免费网站图片| 国产精品入口66mio| 大陆极品少妇内射aaaaaa| 久久久久久久综合狠狠综合| 国产日本韩国在线播放| 欧美日本国产一区| 日本欧美在线| 91精品视频大全| 久久99久久99小草精品免视看| www一区二区www免费| 亚洲永久免费视频| 欧美13一16娇小xxxx| 在线播放日韩专区| 国产免费播放一区二区| 久久综合婷婷综合| 久久综合狠狠综合久久激情 | 久热成人在线视频| 哪个网站能看毛片| 好吊成人免视频| 国模冰冰炮一区二区| 97精品久久久中文字幕免费| 欧美三级网页| 日本手机在线视频| 婷婷成人激情在线网| 丁香花电影在线观看完整版| 91精品国产91久久久久久| 亚洲永久网站| 天天色综合6| 欧美不卡激情三级在线观看| 国产一区二区在线视频你懂的| 国产精品久久久久免费| 老司机午夜网站| 欧美一区二区国产| 久久亚洲综合色| 韩国av一区二区| 亚洲精品a级片| 国产精品传媒| 日本按摩中出| 精品国产一区二区三区日日嗨| 亚洲性生活视频| 91福利区一区二区三区| 久久久精品免费免费| 国产亚洲一卡2卡3卡4卡新区| 欧美激情免费| 最新精品视频在线| 中文字幕av久久| 91av网站在线播放| 久久视频在线播放| 亚洲精品在线视频| 色中色一区二区| 99久久久久久| 国产又黄又大久久| 五月天久久久| caoporn视频在线| 素人av在线| 成人免费淫片免费观看| 日韩国产小视频| 91成人在线观看喷潮教学| 日本午夜一区二区三区| 亚洲最大成人免费视频| 国产69精品久久久久久| 久久高清视频免费| 亚洲精品视频在线看| 天堂久久一区| 岛国在线大片| 日本在线视频网址| 91香蕉在线观看| 日本在线三级| 成人免费黄色网址| 中文字幕在线观看第一页| 无夜福利视频观看| 邻居大乳一区二区三区| 97香蕉久久| 又大又硬又爽免费视频| 日韩一二三区不卡在线视频| 国产精品国模在线| av在线不卡免费看| 99re这里都是精品| 亚洲乱码中文字幕| 亚洲免费观看高清完整版在线| 欧美极品另类videosde| 欧美色男人天堂| 舔着乳尖日韩一区| 欧美成人精品高清在线播放| 亚洲精品一区二区三区香蕉| 欧美xxxxxxxxx| 中文字幕精品www乱入免费视频| 欧美在线激情视频| 99国产超薄丝袜足j在线观看| 亚洲国产一区二区精品视频 | 香港成人在线视频| 中文亚洲欧美| 涩涩在线视频| 91蜜桃在线视频| av在线中文| 天堂电影一区| 欧美天堂一区| 精品视频在线你懂得| 加勒比色老久久爱综合网| 久久福利影院| 香蕉av777xxx色综合一区| 激情小说亚洲一区| 国产精品美女久久久久久久网站| 亚洲影视在线播放| 亚洲精品福利免费在线观看| 亚洲美女视频网站| 欧美亚洲在线播放| 五月天丁香综合久久国产| 污片在线免费看| av大片在线| 狠狠做深爱婷婷综合一区| 国产一区二区三区av电影| 亚洲一区二区欧美激情| 这里只有精品在线播放| 亚洲精品欧美极品| 一本大道东京热无码aⅴ| 中国大陆高清aⅴ毛片| 九九热这里有精品| 久久99伊人| 色综合久久久久久久久| 色偷偷噜噜噜亚洲男人| 91久久大香伊蕉在人线| 麻豆av免费在线| 日本在线高清| 精品一二三四区| 欧美videofree性高清杂交| 国产精品69av| 在线观看av日韩|