国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計 原創

發布于 2025-9-19 09:36
瀏覽
0收藏

VLMs 性能的持續提升,視覺 token 的消耗呈指數級增長。例如,一張 2048× 1024 的圖片在 LLaVA 1.5中需要 576 個視覺 token,而在 Qwen2.5-VL中則需2678 個視覺 token。因此,避免過度使用視覺 token 顯得尤為重要。

大多數方法使用預定的Threshold 來修剪或合并固定數量的視覺 Token。然而,不同問題和圖像中的冗余程度各不相同。因此,是否真的應該在所有場景中應用統一的 Token 壓縮比例?下圖探討了簡單地降低了圖像分辨率以減少視覺 token 的數量,并評估了 Qwen2.5-VL 的在幾個基準上的性能。

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

結論:

  • 左圖:在大多數一般場景中,即使將視覺 token 減少四倍,性能下降也微乎其微。然而,在OCR 相關基準上,token 壓縮會導致顯著的性能下降。
  • 右圖:VisionThink 在性能和效率上均顯著優于之前的工作。

因此,如何讓模型自主選擇何時進行圖像token壓縮?VisionThink是一種新的視 覺 token 壓縮范式。從下采樣圖像開始,智能判斷其是否足以解決問題。否則,模型可以輸出一個特殊 token 以請求更高分辨率的圖像。與現有采用固定剪枝比例或閾值壓縮 token 的高效 VLM 方法相比,VisionThink 自主決定是否按情況壓縮 token。

本文看看VisionThink相關思路,僅供參考。

方法

目標:使VLMs能夠自主判斷給定圖像中的信息是否足以準確回答問題。如下圖,pipline首先處理低分辨率圖像以最小化計算成本。當降采樣圖像中的信息不足以回答問題時,它會智能地請求原始高分辨率輸入。

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

VisionThink 的框架: (a) 左圖 VisionThink 處理分辨率降低4倍的圖像,其中 VLM 直接提供答案。(b) 右圖展示了模型檢測到信息不足并請求高分辨率圖像以回答問題的情況。

從上述可知,強化學習的設計目標變為:使模型能夠判斷何時需要高分辨率。模型必須學會評估下采樣圖像是否包含足夠的信息來回答問題,或者是否需要原始高分辨率圖像。

RL設計

LLM作為評判評估器

傳統問題無法解決:rule-base的方法可以通過規則或精確匹配輕松定義和驗證真實答案。然而,這種方法在通用 VQA 情景中失效,因為有效答案的多樣性和分歧使得基于規則的驗證變得不可行。

因此,通過一個LLM作為評判評估器,僅評估模型響應的純文本準確率。通過比較模型的答案與真實答案來實現

獎勵提示詞如下:可以看到,獎勵值是離散值0或1.

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

多輪GRPO算法

前面提到,pipline會首先將問題和下采樣圖像輸入到 VLM 中。如果信息不足以回答當前問題,模型將自主請求更高分辨率的圖像并生成新的響應。這一過程本質上是一種多輪交互。因此,將原始的 GRPO擴展為多輪 GRPO:

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

那么新問題來了,如何觸發高分辨率圖像進行輸入?樸素的方法:改提示詞,指示模型輸出特定的特殊 token。 提示必須確保模型能夠在 zero-shot 情景下的多輪展開中輸出所需的特殊 token。

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

獎勵函數設計

總體獎勵函數如下,由三部分組成:

通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

  • 準確率獎勵:LLM-as-Judge 方法,其中 0 表示錯誤答案,1 表示正確答案。
  • 格式獎勵:推理過程需包含在“< think>< /think>” 標簽內,最終答案置于 “< answer>< /answer>” 標簽中,且函數調用需符合規定的 JSON 格式。若其中任一格式有誤,則格式化得分為 0。只有當所有格式均正確時,模型才能獲得滿分的格式化得分 0.5。
  • 懲罰控制:由于使用高分辨率圖像通常能提升性能,若沒有任何懲罰,模型傾向于始終請求高分辨率圖像。為防止這種情況,最初遵循 Search-R1對依賴高分辨率圖像的正確回答施加了 0.1 的懲罰。然而,這種方法導致模型偏好直接回答,引發模型僅依賴直接回答的崩潰現象,如下圖中的紫色線所示。原因在于,即使是模糊的低分辨率圖像有時也能讓模型猜出正確答案,而 0.1 的懲罰無意中強化了這種直接回答的偏好。引入一個閾值來控制這種現象。當使用低分辨率圖像正確回答的概率較低時,對直接答案施加 0.1 的懲罰,以鼓勵高分辨率請求;反之,當概率較高時,對高分辨率請求施加 0.1 的懲罰。通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

實驗性能

  • 推理模型推理時間成本與基準性能對比。Qwen-RL 和 Qwen-RL (1/4) 分別表示在Qwen2.5-VL-Instruct 模型上利用 LLM-as-Judge 進行全分辨率圖像和 1/4 分辨率圖像的推理。通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區
  • 與傳統高效 VLM 方法的比較通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區
  • VisionThink 智能地確定高分辨率圖像的比率。應用調整大小表示模型自主請求查看原始高分辨率圖像,而直接回答則表示模型僅使用 1/4 大小的圖像即可回答問題。通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計-AI.x社區

參考文獻:VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning,https://arxiv.org/pdf/2507.13348repo:https://github.com/dvlab-research/VisionThink

本文轉載自???大模型自然語言處理??   作者:余俊輝

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
永久免费av在线| 主播大秀视频在线观看一区二区| 欧美精美视频| 久久影院在线观看| 黄色网址在线播放| 亚洲精品v日韩精品| 伊人久久大香线蕉精品| 香蕉久久a毛片| 成人高清视频观看www| 国产区在线看| 亚洲成人激情自拍| 亚洲免费视频网站| 国产尤物视频在线| 欧美三级日韩在线| 国产欧美日韩综合精品| av影片在线一区| 欧美怡红院视频| av在线一区不卡| 国产精品r级在线| 精品亚洲国产成人av制服丝袜| 国产v亚洲v天堂无码久久久| 综合av第一页| 东北少妇不带套对白| 国产区在线观看成人精品 | 女人天堂在线| 丁香六月综合激情| 色噜噜一区二区| 欧美xxx在线观看| 国产精品成久久久久三级 | 亚洲国语精品自产拍在线观看| 神马日本精品| 免费99热在线观看| 亚洲欧美日韩国产另类专区| 北条麻妃高清一区| 蜜桃免费网站一区二区三区| 成人免费在线小视频| 亚洲高清免费视频| jizz18女人| 欧美精品一卡二卡| 蜜臀久久99精品久久久久宅男| 国产成人无码一二三区视频| 一本久久精品一区二区| 19禁羞羞电影院在线观看| 91在线看www| 亚洲天堂av在线| 曰韩不卡视频| 亚洲一区在线观看免费观看电影高清 | 国产精品美女午夜av| а天堂中文最新一区二区三区| 精品国产百合女同互慰| 成人在线观看免费网站| 欧美v日韩v国产v| 欧美男人天堂| 久久精品视频99| 果冻天美麻豆一区二区国产| 日韩av电影国产| 久久久久久久久久久久久久| 久久久久久久久久码影片| 久久九九99| 亚洲欧美一二三| 久久久久99精品国产片| 2020中文字幕在线| 欧美日韩中文字幕| 在线三级中文| 中文字幕亚洲激情| 免费日韩一区二区三区 | 午夜在线激情影院| 亚洲精品一区中文| 精品国产乱码久久久久久樱花| 看黄在线观看| 国产一区二区日韩| 视频福利一区| 99c视频在线| 国产美女久久久久| 成人免费视频77777| 欧美专区日韩专区| 欧美二三四区| 国产第一区电影| 日日摸夜夜添夜夜添精品视频| 97国产在线播放| 天天av天天翘天天综合网色鬼国产 | 成人18视频在线播放| 成人女人a毛片在线看| 色婷婷精品久久二区二区蜜臀av | 亚洲一区av在线| 国产精品xnxxcom| 欧美精品一区二区三区在线播放| 欧美色999| 国产精品吴梦梦| 久久99精品国产麻豆婷婷洗澡| 亚洲精品高清无码视频| 欧美专区亚洲专区| 精品一区二区三区中文字幕视频| 成人在线观看视频网站| 国产麻豆精品视频| 黄色资源在线看| 亚洲国产一区二区三区四区 | 制服丝袜av成人在线看| 日韩黄色三级| 高清不卡日本v二区在线| 成人免费毛片嘿嘿连载视频…| 69久久夜色精品国产69| 羞羞视频在线观看欧美| 国内自拍视频网| 91精品国产综合久久婷婷香蕉| 欧美成人一级| 色综合久久久久久久久五月| 亚洲黄色片在线观看| 深夜在线视频| www.一区二区三区| 中文久久乱码一区二区| 电影k8一区二区三区久久| 国产美女91呻吟求| 久久久www免费人成精品| 在线中文字幕-区二区三区四区| 欧美在线影院在线视频| 国产成人日日夜夜| 欧美精品电影| 国产精品最新在线观看| 久久久久久久久伊人| 96av在线| 国产在线一区二区三区四区| 国产精品久久久久久福利一牛影视 | 国产高清亚洲| 精品国产91亚洲一区二区三区www| 亚洲精华一区二区三区| 五月天久久综合网| 日韩欧美国产成人| 天天做夜夜做人人爱精品| 国产精品久久久久7777| 精品国产免费一区二区三区香蕉| 99精品美女| 狠狠干五月天| 97视频在线观看视频免费视频| 国产一区二区看久久| 成a人片在线观看| 91人成网站www| 午夜精品久久久久久不卡8050| 国产一区福利| 久草资源站在线观看| 亚洲成人精品av| 国产女优一区| 国产视频福利在线| 91久久国产婷婷一区二区| 一区二区三区 在线观看视频| 亚洲欧美专区| www.亚洲成人网| 亚洲人成在线观看网站高清| 免费成人av资源网| 在线观看免费视频你懂的| 免费精品视频一区二区三区| 欧美精品亚洲一区二区在线播放| 国产精品porn| 川上优的av在线一区二区| 色94色欧美sute亚洲13| 蜜桃一区二区| 福利电影导航| 国产91成人video| 亚洲欧美偷拍三级| 欧美wwwwww| 老司机性视频| 国产日韩精品视频| 欧美中文字幕一二三区视频| 激情欧美一区| 男女在线视频| 国产一区 在线播放| 久久99热这里只有精品国产 | 国产精品亚洲专一区二区三区| 91超碰国产在线| www.激情网| 美女黄色丝袜一区| 国产精品网曝门| 综合亚洲自拍| 青青青免费视频在线2| 丁香五月网久久综合| 日韩女优av电影| 国产福利精品一区二区| 日韩有码欧美| 99re精彩视频| 91精品在线国产| 3751色影院一区二区三区| 紧缚奴在线一区二区三区| 国产精品一区二区精品| 亚洲永久精品免费| 久草一区二区| 日韩中文字幕在线播放| 综合久久久久久| 99精品福利视频| aaaa欧美| 在线一区观看| 亚洲一区二区在线免费观看| 九九九久久久久久| 欧美日韩亚洲精品一区二区三区| 巨乳诱惑日韩免费av| 99视频在线视频| 国产在线精品一区免费香蕉| 91精品久久久久久蜜臀| 91视频你懂的| 国产尤物精品| 久久麻豆视频|