国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

3B Image Captioning小鋼炮重磅來襲,性能比肩Qwen2.5-VL-72B

人工智能 新聞
今天推薦一個 Dense Image Captioning 的最新技術 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功將 DeepSeek-R1 的強化學習方法應用到 image captioning 這種開放視覺任務,創新的以實用性重新定義 image captioning 的 reward。

邢龍和董瀟逸為本篇文章共同第一作者。邢龍是中國科學技術大學博士生,師從林達華教授和吳楓教授,研究興趣主要集中在 multi-modal LLMs 和 efficient AI。董瀟逸是香港中文大學 MMLab 的博士后研究員,同時在上海人工智能實驗室擔任兼職顧問研究員,已在頂級會議和期刊(如 CVPR、ICCV、ECCV 等)上發表了 50 余篇論文,Google Scholar 上獲得超過 10000 次引用。

今天推薦一個 Dense Image Captioning 的最新技術 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功將 DeepSeek-R1 的強化學習方法應用到 image captioning 這種開放視覺任務,創新的以實用性重新定義 image captioning 的 reward。訓練得到的 CapRL-3B 模型,可以成功達到與 Qwen2.5-VL-72B 相當的 captioning 水平!這是 image captioning 領域的一大進展,更是為 GRPO 策略應用于開放任務提供了重要思路!

目前 Huggingface model&dataset 總下載量已經突破 6k,并且正在迭代更強的基座模型以及升級 training recipe,歡迎使用!

  • 論文鏈接:  https://arxiv.org/abs/2509.22647
  • 倉庫鏈接: https://github.com/InternLM/CapRL
  • 模型鏈接: https://huggingface.co/internlm/CapRL-3B
  • 數據鏈接: https://huggingface.co/datasets/internlm/CapRL-2M

圖 1. CapRL 解決了為 image captioning 這種主觀任務設計 reward 的重大挑戰,巧妙的以實用性定義了客觀 verifiable reward,避免了使用 LVLM-as-a-Judge 帶來的 reward hacking,顯著提升了描述的質量

從 SFT captioner 到 RL captioner:Reward 設計重大難點

Image Captioning 旨在為給定圖像生成自然語言描述,彌合視覺與語言世界之間的鴻溝,是目前 ViT 訓練以及 LVLM 預訓練重要的訓練語料。目前大多數 Image Captioning 模型都是基于 LVLMs 并采用監督微調(SFT)方法進行訓練,但是這種訓練方式有兩大問題,數據方面依賴大量由人工或閉源模型標注的數據集,成本高昂且難以擴展,效果方面因為死記硬背的訓練方式導致泛化與多樣性不足。

SFT 的局限性促使研究者轉向一種新的范式 —— 基于可驗證獎勵的強化學習(RLVR)。RLVR 這種訓練范式在 visual grounding,detection 這種包含標準答案的視覺任務上已經得到廣泛應用,然而,將 RLVR 應用于 Image Captioning 等開放性任務仍然非常具有挑戰性,其關鍵在于如何設計一個客觀可靠的 reward 函數。“什么是一個好的圖片描述?”,這個問題帶有很強的主觀性,大家往往看法不一,同一張圖片可能會存在多種不同的合理描述,這就給 verifiable reward 設計帶來很大的困難。

現有的一些方法嘗試使用獎勵模型(reward models)或 LVLM-as-a-judge 來提供 reward,如圖 1(a)所示,但是這種方法非常容易受到獎勵欺騙(reward hacking)的影響。模型可能學會利用獎勵模型的漏洞(偏好冗長或簡短的輸出形式)來獲得更高分數,而非真正生成高質量的描述,這種不可靠的獎勵信號很容易導致在 GRPO 訓練過程中出現異常,圖 1(c)中展示了訓練過程中出現了 caption 過長以及過短的情況,最終導致模型的表現不及預期甚至出現訓練崩潰。

圖 2. CapRL 框架。 我們的 CapRL 采用了解耦的兩階段流程,首先 LVLM 生成圖像描述,然后讓一個 LLM 基于該圖像描述回答視覺多選題,而 LLM 的回答準確率則作為 LVLM 的客觀獎勵信號

Reward 設計新思路:好的 caption 應當能讓純語言模型正確回答視覺問題

為了解決主觀圖像描述任務中 RLVR 獎勵函數缺乏客觀性的難題,我們提出了一種全新的視角:caption quality 與其實用性成正比。當圖像描述足夠詳細且準確時,即使一個純語言模型無法直接 “看到” 圖像,也能回答與圖像相關的視覺問答。例如圖二中,對于問題 “圖片里面誰在大笑?”,當描述中包含 “兔子警官 Judy 正在開懷大笑”,LLM 即可正確回答 “Judy”。

基于這一動機,我們提出了一個高效的兩階段解耦式訓練框架,稱為 CapRL(Captioning Reinforcement Learning)。在 CapRL 框架中,我們讓一個純語言模型根據 caption 去回答與原圖像相關的多項選擇題,LLM 的回答準確率即作為 RLVR 訓練的客觀獎勵信號。基于 CapRL 訓練之后,輸出的描述如圖 3 所示,會在準確率,細節覆蓋等方面大幅度提升

圖 3. CapRL 效果展示。Qwen2.5-VL-3B 經過 CapRL 訓練之后描述的準確性更高,圖片信息覆蓋更全,含有更少幻覺。

CapRL 實驗結果

我們對 CapRL 框架帶來的優勢進行了全面評估。

(i)我們使用 CapRL-3B 標注圖片產生了 CapRL-5M 數據集,并在該數據集上對 LVLM 進行預訓練,在全部 12 項基準測試中均取得了顯著性能提升,與以往的 ShareGPT4V,DenseFusion dataset 的對比中展示出了巨大優勢,效果如圖 4 所示;(ii)此外,借助 Prism Framework 對描述質量進行直接的評估,我們觀察到 CapRL-3B 的性能與 72B 模型相當,并在平均水平上超越基線模型 8.4%。

圖 4. 使用不同預訓練數據集的性能比較結果顯示:CapRL-1M 在全部三個設置中均顯著優于其他數據集,并且當數據規模擴展至 5M 時,模型性能進一步得到提升。

圖 5. 在 Prism 框架下的圖像描述能力對比中,CapRL-3B 的表現可與 Qwen2.5-VL-72B 相媲美,并且顯著優于以 LVLM-as-a-Judge 作為獎勵信號的現有方法。

圖 6. 我們針對 CapRL 進行了豐富的探究實驗,具體實驗設置可查看原論文

我們目前已經開源了論文中的模型,數據集和 QA 構造的代碼,我們還在持續迭代中,歡迎使用!

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-29 09:01:36

2025-03-25 12:11:08

2025-02-24 08:10:00

2025-11-17 09:15:37

2025-07-10 09:03:27

2025-08-11 08:35:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2024-09-19 14:00:00

模型開源代碼

2024-08-01 13:30:00

2024-07-18 12:53:13

2025-02-17 12:30:00

2025-08-06 00:00:11

開源多模態大模型

2024-12-25 09:30:00

2025-10-17 09:08:05

2024-10-17 18:52:41

2025-09-12 10:02:21

AI模型開源

2025-03-27 12:30:36

2025-03-25 09:24:05

2025-08-15 12:53:15

2024-02-19 14:09:00

模型Eagle 7BRNN
點贊
收藏

51CTO技術棧公眾號

国产免费视频传媒| 中文字幕电影在线| 欧美福利在线| 欧美在线视频导航| 精品亚洲a∨一区二区三区18| 精品播放一区二区| 麻豆传媒在线观看| 色综合色综合色综合色综合色综合| 国产三级三级看三级| av色综合久久天堂av综合| 一区二区不卡视频| 精品在线一区二区三区| 亚洲第一综合| 精品一区二区三区视频| 亚洲国产高清国产精品| 日韩黄色小视频| 欧美人xxxxx| 乱码第一页成人| 久久久久久国产精品mv| 国产情侣一区| 久热国产精品视频一区二区三区| 精品96久久久久久中文字幕无| 91在线播放视频| 国产精品v亚洲精品v日韩精品 | 99视频精品免费观看| 福利视频一区二区三区| 欧美va天堂在线| 国产日韩欧美二区| 国产色综合网| 亚洲欧美日韩精品久久久 | 国产区二精品视| 久久婷婷av| 国产日韩欧美大片| 久久一二三国产| 日本视频一二区| 欧洲精品中文字幕| 日韩欧美精品一区二区三区| 视频在线观看一区二区| 人人精品视频| 国产精品自拍首页| 韩国视频一区二区| 黄色片在线免费| 欧美日韩美女在线观看| 日本美女在线中文版| 亚洲黄色在线观看| 视频一区国产| 国产精品久久久久久久久粉嫩av | 欧美日韩国产999| 欧美美女视频| 日韩精品电影网站| 国产清纯在线一区二区www| 福利资源在线久| 91精品欧美综合在线观看最新| 黄色在线观看www| 欧美激情综合色| 午夜精品久久| 成人免费网站入口| 亚洲成av人片| 丰满诱人av在线播放| 美女av一区二区三区| 婷婷综合视频| 女同性恋一区二区| 亚洲aaa精品| 亚洲欧美韩国| 国产欧美日韩中文字幕| 日本中文在线一区| 日本成人a视频| 日韩欧美亚洲一区二区| 97一区二区国产好的精华液| 99在线高清视频在线播放| 国产在线精品一区二区不卡了| 亚洲jizzjizz妇女| 亚洲第一精品电影| 女厕嘘嘘一区二区在线播放 | 成人女性文胸| 欧美日韩精品一区二区| 亚洲视频资源| 精品乱色一区二区中文字幕| 26uuu国产一区二区三区| 岛国在线大片| 久久久久久网址| 蜜乳av一区二区| 伊人网在线免费观看| 日韩视频精品在线| 国产一级一区二区| 中文字幕123| 日韩在线视频国产| 久久福利毛片| 中文字幕在线观| 久久久精品一区二区三区| 1024日韩| 中文在线一二区| 欧美精品在线免费| 美女精品自拍一二三四| 最近97中文超碰在线| 欧美成人午夜激情| 美女免费视频一区二区| 国产一区电影| 日韩av免费在线看| 久久夜色精品国产欧美乱极品| 波多一区二区| 5g影院天天爽成人免费下载| 国产精品视频在线看| av有声小说一区二区三区| 久久综合一区| 欧美丝袜第一区| 精品国产视频| 涩涩视频免费网站| 久久五月情影视| 国精产品一区一区三区mba视频 | 久久99蜜桃综合影院免费观看| 自拍偷拍国产亚洲| 秋霞一区二区三区| 国产黄页在线观看| 亚洲色图18p| 精品亚洲成a人在线观看| 免费的黄网站在线观看| 91免费版网站在线观看| 亚洲日本在线a| 国产精品午夜av| 久久精品免费网站| 欧美成人四级hd版| 久久婷婷一区二区三区| 日韩电影免费观看高清完整版在线观看| 亚洲欧美国产一区二区| 欧美一区二区女人| 日本美女一区二区| 精品丝袜在线| 国产人妻互换一区二区| 亚洲国产精品久久久久秋霞蜜臀 | 国产精品久久久久久久av电影| 日本一区二区三区久久久久久久久不 | 国产麻豆日韩| 一本久久a久久精品亚洲| 欧美高清不卡| 日本免费在线视频| 美女黄毛**国产精品啪啪| 欧美精品久久99| 久久综合九色| 欧洲一区精品| 欧美深夜福利视频| 欧美成人亚洲成人日韩成人| 国产日韩欧美激情| 国产欧美日韩影院| 日韩精品系列| 久久婷婷开心| 精品国产91久久久久久久妲己 | 国产欧美欧洲| 亚洲国产精品人久久电影| 狠狠色狠狠色合久久伊人| 日本在线中文字幕一区二区三区| 成年人视频观看| 国产91在线播放九色快色| 午夜久久久久久电影| 亚洲香蕉网站| 亚洲黄色免费av| 欧洲熟妇精品视频| 国产在线精品一区免费香蕉| 日本精品视频一区二区| 日韩经典一区二区| 国产情侣一区在线| 影音先锋另类| 亚洲欧洲精品在线| 九九热在线精品视频| 亚洲成人你懂的| 日日夜夜一区二区| 97久久亚洲| 波多野结衣在线影院| 热久久最新网址| 日本国产精品视频| 欧美日韩国产首页| 99re66热这里只有精品3直播| 性欧美lx╳lx╳| 成人video亚洲精品| 91视频 -- 69xx| 亚洲在线第一页| 夜夜躁日日躁狠狠久久88av| 亚洲天堂久久久久久久| 亚洲专区一区| 久久久91麻豆精品国产一区| 日韩av资源| 日韩伦理在线免费观看| 国产精品久久9| 亚洲国产第一页| 国产精品美女久久久久久| 国产在线欧美| 国产精品免费精品自在线观看| 免费一级大片| 久久av秘一区二区三区| 国产精品激情av电影在线观看| 精品国产1区2区3区| 亚洲最新在线观看| 国产伦精品一区二区三区视频青涩 | 色哟哟在线观看一区二区三区| 视频一区二区三区在线| 精品精品国产三级a∨在线| 超碰电影在线播放| 日本桃色视频| 青草青青在线视频| 久久精品国产第一区二区三区最新章节 |