国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

港中文聯手美團開源“視覺推理通才”!圖像視頻10類任務一網打盡

人工智能 新聞
香港中文大學MMLab與美團研究團隊開源提出OneThinker——一個基于RL的統一多模態視覺推理通才模型,覆蓋圖像與視頻兩種模態下的十類核心視覺任務。

橫掃31個主流基準、拿捏10類核心任務,視覺模型界的“通才”來了!

香港中文大學MMLab與美團研究團隊開源提出OneThinker——一個基于RL的統一多模態視覺推理通才模型,覆蓋圖像與視頻兩種模態下的十類核心視覺任務。

在31項主流視覺任務測試中,OneThinker均表現亮眼。它不僅能在多任務訓練中實現相互促進,還能在從未見過的任務上做出合理推理,初步展現了通才模型的泛化能力。

雖然以Vision-R1、Video-R1、VLM-R1等為代表的工作,已經在圖像問答、視頻理解、目標檢測等任務上取得顯著效果。

但這類RL模型大部分存在一個限制:只能處理單一模態或單一任務。模態、任務之間缺乏關聯,推理能力被割裂,難以泛化應用。

來看看OneThinker是如何做的。

從“專才模型”到“通才系統”

現實世界中的視覺數據復雜多樣,往往同時包含靜態圖像與動態視頻信息。同時,視覺任務類型也高度多樣化,例如問答、定位、分割、追蹤等。

在這種背景下,傳統的“單任務、單模態”RL思考模型架構存在以下兩個根本性問題:

  1. 無法統一建模現實復雜場景真實應用中往往需要同時理解圖像與視頻內容,并完成多類任務協同,專才模型難以滿足。
  2. 知識隔離,遷移受限模型之間彼此獨立,缺乏知識共享機制,限制了推理能力在任務之間的泛化與遷移。

為了解決這一問題,研究團隊提出了一個“通才思考模型”OneThinker,具備統一理解和推理不同模態、任務的能力。

為了讓OneThinker真正具備統一推理不同模態和任務的能力,研究團隊從兩方面入手:一是構建統一的數據體系,二是優化多任務的訓練方法。

多模態統一任務數據構建

構建具備通用視覺推理能力的模型,首先需要解決數據覆蓋不足、任務割裂的問題。

為此,研究團隊精心搭建了一套數據集,分別用于模型的SFT冷啟動與強化學習訓練:

  • OneThinker-600k覆蓋圖像與視頻兩種模態,涵蓋圖像問答、視頻問答、時空定位、分割、跟蹤等十類核心視覺任務,用于強化學習階段的主力訓練數據。
  • OneThinker-SFT-340k基于Seed1.5-VL對OneThinker-600k生成高質量的思維鏈樣本并過濾,用于SFT階段冷啟動

通過圖像與視頻任務的聯合訓練,OneThinker能夠在空間與時間維度上建立統一的推理能力,從而實現跨模態、多任務的通用理解。

EMA-GRPO:提升多任務RL訓練穩定性

傳統強化學習方法在多任務、多模態場景中存在顯著訓練不平衡問題。

不同任務之間的獎勵結構差異較大(如檢測任務的獎勵稠密,而問答類任務往往稀疏),容易導致樣本間或任務間訓練不平衡的問題。

為此,OneThinker引入了全新的EMA-GRPO(Exponential Moving Average Group Relative Policy Optimization) 強化訓練算法,通過對各任務獎勵標準差進行滑動平均歸一,解決了兩個層面的不平衡問題:

  • 任務內樣本權重不均:緩解模型對低方差樣本的過度依賴;
  • 任務間梯度貢獻失衡:防止稀疏任務在反向傳播中占據主導,抑制其他任務學習。

實驗結果表明,EMA-GRPO能顯著提升強化學習階段的訓練穩定性與收斂速度,為大規模統一推理模型的多任務訓練提供了有效支撐。

實驗結果

為了全面評估OneThinker的能力,研究團隊在圖像與視頻兩個模態下不同任務的31個主流 benchmark上進行了系統測試,覆蓋圖像問答、視頻理解、空間定位、時間定位、目標分割、目標追蹤等10類核心視覺任務。

OneThinker在圖像問答任務中表現出色,MMMU達到70.6%,MathVerse達到64.3%,在視頻理解上,VideoMMM取得了66.2%的表現。

對于時間定位和空間定位任務中,模型在RefCOCO testA的空間定位任務中也取得了93.7%的高分,Charades和ActivityNet的R@0.5分別達到68.3和43.6。

同時,OneThinker在追蹤任務GOT-10k上AO達到73.0, 在視頻分割任務ReasonVOS上J&F得分為54.9,體現了其在感知類任務中的穩健表現,更多的任務表現請參考原文。

研究團隊還發現,在某些任務和模態之間,OneThinker能實現有效的知識遷移與共享,不同任務之間相互促進。

同時,OneThinker在未見任務上展現出零樣本能力,能直接適應如點追蹤、圖像質量評估、GUI理解和旋轉目標檢測等任務,體現出強大的任務泛化能力。

可以說,OneThinker的推出,不僅展示了強化學習在統一多模態、多任務視覺推理上的潛力,也為構建真正的視覺通才模型提供了清晰的路徑。

在大模型不斷走向多模態、強推理、通才化的趨勢下,OneThinker的工作或許只是一個起點,但它所驗證的方向,正在成為通往通用視覺智能(AGI)的關鍵一環。

更多細節,請參考原文。

論文地址:https://arxiv.org/pdf/2512.03043

代碼地址:https://github.com/tulerfeng/OneThinker

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-04-26 00:25:52

Rust語法生命周期

2013-10-16 14:18:02

工具圖像處理

2021-08-05 06:54:05

流程控制default

2024-02-27 10:11:36

前端CSS@規則

2021-10-11 07:55:42

瀏覽器語法Webpack

2010-08-25 01:59:00

2011-12-02 09:22:23

網絡管理NetQos

2013-08-02 10:52:10

Android UI控件

2024-08-26 10:01:50

2024-04-07 08:41:34

2024-06-12 00:00:05

2023-04-06 09:08:41

BPM流程引擎

2020-10-19 06:43:53

Redis腳本原子

2023-04-03 08:30:54

項目源碼操作流程

2023-09-26 00:29:40

CSS布局標簽

2009-04-02 10:17:00

交換機產品選購

2021-05-20 11:17:49

加密貨幣區塊鏈印度

2019-07-24 15:30:00

SQL注入數據庫

2020-02-21 08:45:45

PythonWeb開發框架

2023-09-06 18:37:45

CSS選擇器符號
點贊
收藏

51CTO技術棧公眾號

久久999免费视频| 蜜臀久久99精品久久久久宅男| 2017欧美狠狠色| 99久久99久久精品免费看蜜桃| 丁香婷婷久久久综合精品国产| 免费视频最近日韩| 欧洲一区二区日韩在线视频观看免费| 成年人在线观看| 中文日韩欧美| 国产精品久久999| 青青一区二区| 97久久精品人人澡人人爽缅北| 欧美成人片在线| 亚洲美女炮图| 网站一区二区| 国产精品亲子伦对白| 成人三级视频在线播放| 久久久久久久综合日本| 日本视频一二区| 欧美一区二区三区视频免费| 大胆国模一区二区三区| 成人福利在线视频| 久久99精品久久久| 欧美成年黄网站色视频| 欧美激情精品久久久久久黑人| av一区二区在线播放| 日本一区不卡| 欧美96一区二区免费视频| 99视频免费观看| 欧美.日韩.国产.一区.二区| 国产精品自产拍在线观看中文| 激情综合网站| 欧美裸身视频免费观看| 欧美成人午夜77777| 欧美国产日本在线| 成人av资源网址| 欧美亚洲第一区| 精品中文在线| 黑人极品videos精品欧美裸| 国产调教视频在线观看| 日韩视频在线永久播放| 男女视频在线看| 亚洲精品国产a久久久久久| 黄色在线视频观看网站| 1卡2卡3卡精品视频| 色偷偷一区二区三区| 91美女视频在线| 欧美在线激情网| 国产一区二区高清| 欧美中文字幕精品| 国产高清一级毛片在线不卡| 亚洲永久字幕| 国产精品网站视频| 国产精品影院在线| 老司机精品视频一区二区三区| 一本色道久久综合亚洲91| 国产综合 伊人色| 日本在线中文字幕一区二区三区| 亚洲妇熟xx妇色黄| 日韩精品伦理第一区| 日韩片欧美片| 欧美激情手机在线视频| 青青视频一区二区| 国产精品白丝jk喷水视频一区| 亚洲一区二区三区无吗| 成人黄视频免费| 国产一级久久| 天天操天天干天天玩| 亚洲男人的天堂在线aⅴ视频| 免费h片在线| 91精品国产91久久久久久最新毛片| 成人影视在线播放| 精品国产一区久久| 成人资源在线播放| 亚洲qvod图片区电影| 国内欧美视频一区二区| jizz18女人| 亚洲男人天堂2024| 成全电影大全在线观看| 欧美日韩另类在线| 午夜免费电影一区在线观看| 久草在线免费福利资源| 亚洲欧洲制服丝袜| 香蕉视频在线观看免费| 91成人免费看| 欧美亚洲日本国产| 网站一区二区| 精品久久久久久久久久中文字幕| 欧美成人bangbros| 精品亚洲国内自在自线福利| 色呦呦网站在线观看| 欧美日本精品在线| 日韩黄色片在线观看| 亚洲mv在线| 亚洲欧美日韩国产中文专区| heyzo久久| 久久精品.com| 成人午夜高潮视频| 久久国产精品99国产精| 一区二区三区四区国产精品| 日本视频一区二区不卡| 国产亚洲福利社区一区| 欧美激情理论| 中国色在线日|韩| 日本h片在线看| 国产四区在线观看| 91传媒免费看| 欧美激情精品久久久久久蜜臀| 一本色道**综合亚洲精品蜜桃冫| 美腿丝袜亚洲一区| 日韩精品免费一区二区在线观看| 黄在线观看免费网站ktv| 午夜影院观看视频免费| 97av中文字幕| 日韩视频中文字幕| 乱人伦精品视频在线观看| xxxx影院| 日本一区二区三区在线播放| 91在线免费播放| 亚洲女同志freevdieo| 精品久久久久久乱码天堂| 中文在线资源观看网站视频免费不卡 | 国产黄在线观看| 中文字幕中文字幕99| 7m精品福利视频导航| 日韩一级二级三级| 国产清纯白嫩初高生在线观看91| 一本一本久久a久久综合精品| www.欧美视频| segui88久久综合9999| 在线免费av观看| 中文字幕第21页| 51xx午夜影福利| 日本在线免费观看一区| 18成人免费观看网站下载| 2019中文在线观看| 欧美精品在线免费观看| 日韩中文字幕在线视频播放| 精品99一区二区三区| 日韩一区二区在线观看视频播放| 午夜精品久久久久久不卡8050| 26uuu成人网一区二区三区| 久久se精品一区精品二区| 亚洲国产高清视频| 欧美人与拘性视交免费看| 日韩在线观看一区二区三区| 97精品资源在线观看| 国产亚洲观看| 国产精品白丝av嫩草影院| 一区二区三区自拍视频| 6080亚洲理论片在线观看| 日本一区二区三区播放| 久久夜色电影| 欧美片第1页综合| 韩国欧美一区| 久久三级福利| 国产精品123区| 97精品视频在线观看自产线路二| 国产a视频精品免费观看| 91视频观看免费| 中文字幕一区在线| 欧美中文字幕不卡| 亚洲黄在线观看| 欧美俄罗斯乱妇| 成人免费网视频| 韩国黄色一级大片| 日韩日韩日韩日韩| 精品国产白色丝袜高跟鞋| 欧美日韩在线精品一区二区三区激情综合 | 亚洲日产av中文字幕| 欧美日本一区二区视频在线观看| 精久久久久久| 国产日韩欧美亚洲| 欧美亚洲国产一区在线观看网站| 亚洲成年人在线| 国产精品第10页| 中国人体摄影一区二区三区| 五月婷婷开心综合| 日本高清成人vr专区| 精品在线99| 成人免费视频国产在线观看| 欧美日韩亚洲精品内裤| 一本一本久久a久久精品综合小说| 欧美最猛性xxxx| 法国空姐在线观看免费| 欧美13~18sex性hd| 午夜精品久久久久久久久久蜜桃| 在线成人直播| 国产精品网站在线播放| 亚洲国内高清视频| 91久久久久久久久| 男男互摸gay网站| 一级毛片在线播放| av网站导航在线观看免费| 精品99视频| 一区二区亚洲欧洲国产日韩| 爱情岛论坛成人| 国产一区视频在线观看免费| 亚洲人成网在线播放| 超碰在线公开超碰在线|