国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

帶圖推理碾壓同類開源模型!港中文微軟等開源OpenThinkIMG框架,教AI學會使用視覺工具

人工智能 新聞
港中文、微軟聯合8家單位推出OpenThinkIMG開源框架,這是一個專為提升AI視覺工具使用和推理能力而設計的一站式平臺。

教AI學會使用工具,帶圖推理就能變得更強?!

港中文、微軟聯合8家單位推出OpenThinkIMG開源框架,這是一個專為提升AI視覺工具使用和推理能力而設計的一站式平臺。

圖片

眾所周知,我們人類在解決問題時,常常會借助視覺工具:解幾何題時畫輔助線,分析圖表時用熒光筆標記。這些“動手”操作,極大地增強了我們的認知和推理能力。

因此,一旦將同款“動手操作”能力賦予AI,其推理能力也將大大提升。

不過問題是,雖然現在已經有很多強大的視覺工具(分割、檢測、OCR等),但讓AI真正學會如何以及何時智能地使用這些工具,卻面臨巨大挑戰:

  • 工具集成難:不同工具接口各異,想把它們整合到一個AI系統里,費時費力。
  • 訓練數據缺:教AI用工具,需要大量“示范操作”數據。這種數據怎么來?質量如何保證?
  • 模型適應差:傳統方法訓練出的AI,往往只會“照本宣科”,遇到新情況就傻眼,缺乏靈活應變和自主學習的能力。

而OpenThinkIMG框架的出現正是為了解決上述問題,與此同時,團隊還公開了其核心的自適應工具使用訓練技術V-ToolRL

下面具體來看。

OpenThinkIMG:為AI打造的“超級工具箱”

如框架圖所示,OpenThinkIMG集工具部署、數據生成、智能體訓練于一體。

圖片

其核心特性如下:

第一,模塊化視覺工具部署 (Tool Deployment)。

簡單來說,它提供標準化的視覺工具接口,無論是已有的成熟工具(如GroundingDINO, SAM, OCR等),還是你自己的新工具,都能輕松接入OpenThinkIMG的“工具箱”。

并且每個工具都可以作為獨立服務部署,互不干擾,方便管理和按需擴展。AI模型可以通過框架內的“工具控制器”按需調用。

第二,高效的智能體訓練框架 (Training Framework)。

它不僅支持傳統的監督微調 (SFT),更集成了團隊創新的V-ToolRL (Visual Tool Reinforcement Learning) 算法。

這一算法讓AI通過強化學習,在與視覺工具的真實交互中,從錯誤中學習,自主探索和掌握最佳的工具使用策略。

具體而言,需要先通過SFT進行“理論學習”(冷啟動),然后通過V-ToolRL進行“上路實操”,根據任務完成情況獲得獎勵或懲罰,不斷優化策略。

第三,支持高質量訓練數據生成 (Scalable Trajectory Generation)。

為了給V-ToolRL提供優質的初始“教材”,OpenThinkIMG內置了一套團隊提出的高效、可擴展的視覺工具使用軌跡生成方法。

具體過程分為三步:

  • AI規劃師 (GPT-4o) 出馬:先讓大模型規劃出解決問題的初步工具步驟。
  • 工具真實執行與記錄:調用OpenThinkIMG中的工具服務,實際執行規劃,并記錄下每一步的輸入輸出。
  • 嚴格質檢與篩選:結合AI模型(如Qwen2-VL-72B)、規則和人工審查,層層把關,確保數據質量。
圖片△高質量視覺軌跡數據構建流程

通過OpenThinkIMG的這些核心能力,研究者和開發者可以更專注于模型算法的創新,而不必在工具部署和數據準備上耗費過多精力。

OpenThinkIMG + V-ToolRL:表現超過GPT-4.1

團隊在具有挑戰性的圖表推理任務上,使用OpenThinkIMG框架訓練了基于V-ToolRL的智能體。

如圖所示,V-ToolRL在ChartGemma測試集上的性能表現(基于OpenThinkIMG訓練)如下:

1、大幅超越SFT:基于一個2B的Qwen2-VL,經過V-ToolRL訓練后,準確率比單純SFT提升了28.83個百分點;

2、碾壓同類開源模型:V-ToolRL的表現平均超過了如Taco、CogCom等基于監督學習的工具使用基線12.7個百分點,而且團隊的模型參數量更小;

3、媲美頂尖模型:V-ToolRL的表現超過GPT-4.1,同時和Gemini達到持平的效果。

圖片

結果充分證明了OpenThinkIMG框架的強大支撐能力,以及V-ToolRL在學習自適應工具調用策略上的優越性。

那么,V-ToolRL是如何在OpenThinkIMG中學習的呢?

通過OpenThinkIMG的訓練環境,團隊觀察到V-ToolRL智能體展現出以下學習特性:(a) 工具調用更高效 (b) 推理更詳盡 (c) V-ToolRL 學習更快更好。

圖片圖片圖片

具體而言,隨著訓練的進行,模型平均調用的工具次數顯著下降,說明它學會了“好鋼用在刀刃上”,只在必要時才使用工具。

而且模型生成的答案(包括思考過程)長度增加了,表明它能夠進行更詳細、更深入的推理。

最后,V-ToolRL(集成了視覺工具的反饋)相比純文本的強化學習,學習速度更快,最終效果也更好,證明了“眼見為實”的重要性。

下圖展示了V-ToolRL在具體問題上的表現。面對復雜的圖表,V-ToolRL能夠:

  • 餅圖分析 (上):通過ZoomInSubfigure放大關鍵區域,再用OCR精準讀取數值,最終正確計算出差異,而直接解讀的模型則容易出錯。
  • 折線圖趨勢 (下):利用Point定位數據點,DrawVerticalLineByX輔助比較,準確找出趨勢相同的類別。
圖片△V-ToolRL (上側工具輔助) vs GPT-4.1 (下側直接解讀)

這些案例生動地展示了V-ToolRL如何通過結構化的工具調用,實現比直接視覺解讀更準確、更可解釋的推理。

小結一下,OpenThinkIMG框架的核心貢獻在于:

1、一個開放、強大的工具部署與訓練平臺:解決了工具集成和智能體訓練的難題。

2、內置高效數據生成方法:為模型訓練提供高質量“燃料”。

3、V-ToolRL作為核心訓練算法:使AI能夠真正學會自主、智能地使用視覺工具。

團隊表示,OpenThinkIMG將為開發能夠真正“用圖像思考”的下一代AI智能體提供堅實的基礎設施。

未來,他們將繼續擴展OpenThinkIMG支持的工具和模型,探索更復雜的任務場景,并期待與社區共同推動這一激動人心的領域向前發展。

論文第一作者蘇肇辰為蘇州大學三年級研究生,香港科技大學準博士生,在NeurIPS、ACL等國際頂級會議上發表多篇研究成果。項目通訊作者為港中文成宇教授。

技術報告:
https://arxiv.org/pdf/2505.08617
GitHub倉庫:
https://github.com/zhaochen0110/OpenThinkIMG
數據集和模型:
https://huggingface.co/collections/Warrieryes/openthinkimg-68244a63e97a24d9b7ffcde9

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-10-22 00:00:00

2025-05-08 16:45:32

開源Phi-4推理模型

2021-02-25 15:54:41

微軟開源Error Analy

2025-07-14 09:23:45

2023-12-03 08:49:38

微軟開源

2025-09-25 12:42:33

2021-12-01 10:05:12

模型人工智能計算

2024-09-18 13:03:52

AI視頻生成

2022-07-17 13:07:26

模型開源

2024-03-04 13:36:00

模型訓練

2025-02-17 10:36:00

微軟開源模型

2025-01-27 09:51:24

AI模型開源

2025-11-19 08:51:13

2024-10-21 08:24:29

Florence-2視覺語言模型VLM

2025-12-12 09:18:06

AI開源模型

2023-04-10 13:08:46

開源思維導圖

2025-06-26 09:13:22

2018-12-06 10:07:49

微軟機器學習開源

2025-02-24 10:07:04

2020-11-25 10:34:45

AI 數據工具
點贊
收藏

51CTO技術棧公眾號

97精品视频在线| 欧美日韩精品在线视频| 国产精品美女久久久久久久久久久| 国产视频亚洲色图| 欧美亚洲禁片免费| 91视频免费观看| 狠狠色狠狠色综合日日五| 日韩色视频在线观看| 国产精品91免费在线| 国产精品538一区二区在线| 日韩在线免费电影| 涩涩视频在线| 国产精选在线| 久久成人av| 免费在线观看成人av| 国产午夜三级一区二区三| 欧美tk—视频vk| 99精品视频精品精品视频| 午夜精品福利影院| 窝窝社区一区二区| 人人狠狠综合久久亚洲| 日本大片在线播放| 国产成+人+综合+亚洲欧美| 日韩a一区二区| 日本道色综合久久| 午夜精品久久久久久久蜜桃app | 精品国产福利视频| 麻豆乱码国产一区二区三区| 国产亚洲欧美一区二区| 最新av在线| 成人欧美大片| 亚洲制服少妇| 欧美精品免费视频| 99超碰麻豆| 麻豆国产在线播放| 久久精品久久久| 亚洲成人免费在线观看| 26uuu日韩精品一区二区| 性欧美videossex精品| 久久人体av| 久久久777精品电影网影网 | 国内激情久久| 欧美日韩在线视频观看| 国产精品亚洲网站| 日韩三级电影网| 国内不卡的一区二区三区中文字幕| 97久久超碰国产精品| 日韩一区二区精品视频| 日韩中文字幕在线视频观看| 豆花视频一区| 成人免费一区二区三区视频| 中文字幕亚洲综合| 韩日视频在线观看| 日韩av黄色| 国产午夜亚洲精品不卡| 国产+人+亚洲| 超碰在线电影| 午夜免费欧美电影| 久久久久.com| 国产精品久久久久永久免费观看| 91在线小视频| 欧美色视频一区| 国产九色精品| 亚洲成av人影片在线观看| 99999色| 西野翔中文久久精品国产| 亚洲国产一区二区在线播放| 欧美自拍大量在线观看| 九色丨porny丨| 欧美/亚洲一区| 亚洲黄色www| av在线dvd| 9色国产精品| 精品免费视频一区二区| 国产 日韩 欧美在线| 欧美成人明星100排名| 在线高清一区| 精品久久国产精品| 狠狠操在线视频| 国产精品资源网| 久久久中文字幕| h网站在线免费观看| eeuss影院一区二区三区 | 成人在线播放网址| 999久久久91| 日韩精品在线第一页| 男人的天堂网av| 日韩电影在线免费看| 欧美黑人xxx| 噜噜噜在线观看播放视频| 国产一区二区三区免费观看| 成人久久一区二区三区| 自拍偷拍亚洲视频| 在线一区二区三区四区五区| 欧美三级资源在线| 国产 福利 在线| 亚洲麻豆视频| 国产精品欧美激情| 波多野结衣久久精品| 在线观看一区日韩| 99免费视频| 日本中文字幕一区| 韩国精品一区二区三区六区色诱| 露出调教综合另类| 日韩在线视频免费观看| 免费在线看污片| 欧美美女一区二区在线观看| 三区精品视频观看| 日韩欧美综合| 久久艳片www.17c.com| 日本不卡视频一区二区| 国产日韩欧美一区二区三区乱码 | 99久久国产免费免费| 成人日韩精品| 亚洲精品av在线播放| 2023欧美最顶级a∨艳星| 国产乱码字幕精品高清av| 奇米影视首页 狠狠色丁香婷婷久久综合 | a一区二区三区亚洲| 一区二区欧美久久| 日本在线啊啊| 欧美成人一区二区三区| 18在线观看的| 欧美成人一区二区三区在线观看| 在线观看国产中文字幕| 久久99精品国产91久久来源| 日韩久久不卡| 日韩专区一卡二卡| 中文字幕一区二区三区精彩视频| 久久先锋资源| 成人手机在线播放| 97se亚洲国产综合自在线不卡| 精品丰满人妻无套内射| 久久精品国产色蜜蜜麻豆| 欧美精品二区三区四区免费看视频| 欧美色图首页| 国产精品中出一区二区三区| 视频一区视频二区中文| 久久久久久久久影视| 国产亚洲欧洲一区高清在线观看| 最近中文字幕2019第二页视频| 中文字幕欧美区| 每日在线更新av| 99精品视频在线免费观看| 色偷偷亚洲女人天堂观看欧| 久久蜜桃av一区二区天堂| 99re6热在线精品视频播放| 中文字幕制服丝袜一区二区三区| 亚洲自偷自拍熟女另类| 国产精品99久久久久久久vr| 五月亚洲综合| 精品国产精品自拍| 黄色在线播放| 91麻豆精品国产91久久久久久久久| 中文字幕一区久| 国产亚洲一区二区在线| mm131午夜| av在线播放成人| 在线看片线路1| 亚洲成年人在线| 日韩mv欧美mv国产网站| 日本公妇乱淫免费视频一区三区| 国产精品亚洲欧美| 精品视频在线观看一区| 国产91丝袜在线播放0| 国产精品沙发午睡系列| 中文字幕在线不卡视频| 意大利激情丛林无删减版dvd| 精品1区2区在线观看| 亚洲啊v在线| 亚洲最大成人免费视频| 天堂成人免费av电影一区| 欧美大黑帍在线播放| 精品国产91久久久久久老师| 香蕉视频在线免费看| 中文字幕一精品亚洲无线一区| 久久中文亚洲字幕| 一区二区视频在线观看| 久久综合久久99| av中文字幕在线观看| 亚洲精品一区在线观看香蕉| 女主播福利一区| 综合网插菊花| 久久这里只有精品视频首页| 国产一区二区三区四区老人| 亚洲这里只有精品| 亚洲欧美国产精品专区久久| 欧美日韩国产高清| 强伦女教师2:伦理在线观看| 欧美性做爰猛烈叫床潮| 成人直播在线观看| 黄色一级片av| 日韩一区二区在线看| 99久久.com| 丁香六月婷婷| 久久人人爽人人爽爽久久| 国内精品伊人久久久久av一坑| 美女毛片在线看| 国产精品久久久久免费a∨大胸| a在线播放不卡|