国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型如何準確讀懂圖表?微軟亞研院教它“看、動手、推理”

人工智能 新聞
微軟亞洲研究院聯合清華大學、香港科技大學提出PixelCraft:以高保真圖像處理與非線性多智能體推理為兩大支柱,系統性提升結構化圖像理解的準確性、魯棒性與可解釋性,在多個圖表與幾何基準上給出一致的性能增益。

多模態大模型(MLLM)在自然圖像上已取得顯著進展,但當問題落在圖表、幾何草圖、科研繪圖等結構化圖像上時,細小的感知誤差會迅速放大為推理偏差。

線性、剛性的“鏈式思考”流程也難以支撐復雜任務中必要的回溯與分支探索。

為此,微軟亞洲研究院聯合清華大學、香港科技大學提出PixelCraft:以高保真圖像處理非線性多智能體推理為兩大支柱,系統性提升結構化圖像理解的準確性、魯棒性與可解釋性,在多個圖表與幾何基準上給出一致的性能增益。

結構化圖像的痛點與PixelCraft的切入

自然圖像通常憑借紋理、局部模式等特征即可完成理解;而結構化圖像把信息編碼進坐標、數據點、連線與數值標注,要求模型在像素級細節上建立可驗證的“符號化抽象”。

在這樣的場景中,傳統只依賴文字CoT的方式往往犧牲了空間與結構細節。

“視覺CoT”雖然嘗試插入中間圖像線索,但受制于低保真的圖像處理和簡單的線性處理鏈條,這類方法在應對復雜真實問題時效果有限,這一局限性也在CharXiv、ChartQAPro等更貼近真實場景的基準上得到體現。

PixelCraft將這一問題拆成兩端:先把“看準”做扎實,再讓“思考”更靈活。

從“聰明的眼睛”到“穩健的雙手”,再到“討論式思考”

  • 系統組成:PixelCraft的系統由調度器(dispatcher)、規劃器(planner)、推理器(reasoner)、視覺評審與規劃評審(critics)以及一組視覺工具代理(toolagents)構成。調度器負責工具和角色的選擇與編排;規劃器維護圖像記憶(imagememory)并管理討論流程;推理器承擔多模態推理;視覺與規劃評審分別負責在環質量控制與事后復盤;視覺工具代理執行具體圖像操作
  • 高保真圖像處理:微調后的grounding模型將目標區域的文本指代精準映射到像素級坐標區域,并以此為基礎設計了一套半自動生成工具代碼的流程。通過得到的視覺工具庫將后續推理建立在可驗證的中間證據之上。
  • 三階段工作流:圍繞“工具選擇→協作討論與回溯→自我審查與再規劃”展開。與將所有中間圖一次性并入上下文不同,規劃器利用圖像記憶進行選擇性回看與復用,以支持分支探索與回溯,并降低長上下文負擔。

高保真視覺處理

研究在高質量標注數據上對Qwen2.5-VL-3B-Instruct進行微調,得到像素級grounding模型,可以將目標區域的文本指代精準映射到像素級坐標區域。

以此為錨,系統通過工具代理調用一組標準化的傳統CV操作(如裁切、放大、按圖例遮擋、輔助線標注等),使中間編輯步驟可驗證、可復現,為后續推理提供穩定證據。

系統的工具并非靜態預設,而是通過自動生成—標準化—調用的閉環形成:系統基于任務樣本由大模型生成候選工具,經聚類與重寫后作為工具庫備用(一些具體的工具處理示例如下圖所示)。

子圖裁剪/局部放大

帶圖例的數據繪制/添加輔助線

隨后結合grounding坐標與調度/規劃策略,實現精確、可重復、可回溯的工具調用。

在討論式推理中,工具按需被動態選擇與復用,從而把“看準”(定位與編輯的準確性)與“能做”(可執行操作)有效銜接。

在合成與標注評測集上,微調后的grounding在子圖區域、圖例區域、文本標簽與刻度點的IoU/PCK指標均較基礎模型有顯著提升。

保持智能體系統的基座模型不變,切換不同grounding模型會傳導至下游基準(如CharXiv、ChartQAPro等)的最終精度,說明定位質量對整體性能具有關鍵影響。

由此,“高保真定位+工具閉環”有效減少了由“截錯/標錯”引起的誤差傳播。

非線性、多角色的“討論式推理”

PixelCraft的討論式流程由規劃器統籌:先選擇合適的工具與角色,隨后規劃器根據當前上下文按需選擇下一角色及其輸入(圖像或文本),并角色間傳遞中間結果。

推理過程中由視覺評審判定圖像處理是否滿足目標,再由規劃評審事后復盤整條鏈路,必要時觸發再規劃再推理。

與“只在上一張圖上繼續”的線性鏈不同,圖像記憶讓規劃器能在討論中主動回看早期證據、嘗試備選分支、修訂假設。

這一“discussion-centric workflow”在結構化圖像場景中尤顯必要:細節一旦出錯,應盡快止損并回溯而不是被動前行。

實驗:多基座、多數據集的一致增益

在三個具有挑戰性的圖表理解基準CharXiv/ChartQAPro/EvoChart上,PixelCraft在GPT-4o等大模型的基礎上取得大幅提升,且跨模型表現一致。

消融實驗顯示,可靠的圖像編輯+在環校驗+事后復盤共同支撐了系統的穩定性與可解釋。

研究還構造了和常規VisualCoT的對照:把歷史中間圖像全部并入上下文、讓模型在線性鏈里“帶圖思考”。

結果顯示,在CharXiv與ChartQAPro上,簡單的VisualCoT結果明顯低于PixelCraft的范式。

這從正反兩面印證:不是“把圖都塞進去”就能解決問題,選擇性記憶+討論式回溯才是更有效的組織方式。

工具層面,圖表類的子圖裁切、局部放大、輔助線標注、按圖例遮擋覆蓋了大多數分析操作。

幾何類的點連線、作垂線/平行線為推理提供“草圖級”證據。論文給出了工具使用頻率與單項貢獻的統計,也展示了多種具體處理案例。

PixelCraft提出了一條面向結構化圖像的半自動化新范式:包含工具制造,工具選擇,工具調用,過程修改。

先以像素級grounding把證據找準,再把證據交給“工具化的雙手”去做可驗證的編輯,最后在規劃器主導的討論式流程中組織推理,并用圖像記憶貫穿回溯與分支探索。

通過這一整套設計,系統在多個benchmark上取得跨模型一致的提升,且中間過程清晰可檢。

對需要在圖表、幾何等結構化圖像而言,PixelCraft顯著提升了模型推理的準確性和魯棒性。

論文鏈接:https://arxiv.org/pdf/2509.25185

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-08-09 12:48:35

2024-03-28 12:52:00

AI模型

2023-06-20 09:27:09

微軟研究

2023-04-03 09:56:22

模型系統

2013-11-07 09:14:01

微軟大數據

2021-11-29 09:45:32

模型人工智能深度學習

2025-03-10 08:20:00

微軟AI模型

2023-10-26 08:40:15

模型隱私推理

2023-09-01 14:49:09

AI微軟

2025-02-24 09:00:00

微軟模型算法

2024-09-12 13:50:00

模型訓練

2013-10-31 11:19:09

微軟語音翻譯手語翻譯

2023-03-03 13:38:42

模型微軟

2020-12-18 11:06:44

微軟AI技術

2025-06-18 09:06:00

2023-12-03 08:49:38

微軟開源

2024-12-02 12:37:42

2023-08-18 14:34:00

研究模型

2025-08-01 14:32:35

AI模型訓練

2025-05-26 08:52:00

點贊
收藏

51CTO技術棧公眾號

日韩精品中文字幕第1页| 在线观看二区| 中文字幕大看焦在线看| 久久九九热免费视频| 亚洲午夜精品17c| 六月婷婷色综合| 亚洲三级性片| 日韩免费一区二区| 久久精品国产亚洲精品| 国产精品久久久av| 波多野结衣一区二区三区在线观看 | 秋霞影院午夜丰满少妇在线视频| 欧美人与动牲性行为| 国产精品最新| 精品午夜一区二区三区在线观看| 久久视频精品在线| 国产成人鲁鲁免费视频a| 亚洲宅男天堂在线观看无病毒| 日韩精品免费视频人成| 少妇精品久久久一区二区| 国产日韩电影| www.亚洲视频| 天天综合网久久| 日韩电影中文字幕| 欧美在线欧美在线| 亚洲综合av一区二区三区| 在线激情视频| 日本aa在线观看| 久久久www免费人成黑人精品| 欧美一区二区三区…… | 精品一区二区在线看| 欧美日韩亚洲一区二区三区在线观看 | 久久综合国产精品| 精品国产91乱高清在线观看 | 69久久夜色精品国产69蝌蚪网| 亚洲人午夜精品免费| 午夜老司机精品| 在线观看亚洲专区| 亚洲视频 欧洲视频| eeuss影院一区二区三区| 国产精品实拍| 久久99精品久久久久久国产越南 | 全球成人中文在线| 一区二区欧美激情| 日韩精品一区国产麻豆| 欧美天天综合色影久久精品| 亚洲欧洲综合另类| 亚洲国产精品传媒在线观看| 成人爱爱电影网址| 国产成人在线免费| 美国av一区二区| 香蕉久久夜色精品| 尤物网精品视频| 婷婷中文字幕一区| 精品一区二区三| 亚洲国产合集| 国产一区二区三区不卡av| 国产精品久久久久久久久免费高清 | 国产麻豆精品95视频| 亚洲欧美网站| 国产亚洲综合精品| 1024日韩| 一本久久综合| 99精品国产在热久久婷婷| 亚洲精品va| 欧美专区日韩专区| 韩国成人av| 视频在线这里都是精品| 午夜日韩视频| 色综合天天做天天爱| 国产精品视频一区二区三区四| 国产色视频在线播放| 红杏视频成人| 国产精品国产亚洲精品看不卡15| 88国产精品欧美一区二区三区| 欧美国产日本在线| 精品视频9999| 欧美激情精品久久久久| 欧美国产高跟鞋裸体秀xxxhd| 久久99久久亚洲国产| 美女撒尿一区二区三区| 欧美夫妻性生活xx| 日本sm极度另类视频| 国产欧美在线看| 91视频网页| 欧美极品一区二区| 免费观看30秒视频久久| 欧美mv和日韩mv国产网站| 夜夜爽99久久国产综合精品女不卡 | 中文字幕av一区二区三区人| 亚洲国产精彩中文乱码av在线播放 | 国产精品激情| 欧美三级蜜桃2在线观看| 国产精品久久久对白| 国产特黄在线| 在线欧美一区| 91精品午夜视频| 手机福利在线视频| caoporm免费视频在线| 亚洲视频综合| 欧美日韩一区不卡| 国产精品一区二区欧美| 欧美××××黑人××性爽| 99久久99精品久久久久久| 美女精品视频一区| 国产在线观看免费麻豆| av电影一区二区| 亚洲黄色av一区| 亚洲精品中文综合第一页| 日韩精品免费| 日本高清久久一区二区三区| 日韩精品三区四区| 欧美精品v日韩精品v国产精品| 性色一区二区| 亚洲一区中文字幕| 综合激情网...| 亚洲精品成人久久电影| 神马电影在线观看| 国产欧美日韩麻豆91| 奇米视频888战线精品播放| 亚洲视频国产| 久久高清视频免费| 在线免费观看黄色网址| 久久久久久久久久看片| 懂色一区二区三区av片| 亚洲a一区二区三区| 久久亚洲精品网站| 日韩伦理在线一区| 亚洲国产精品国自产拍av| 国产原创欧美精品| 麻豆av在线免费看| 亚洲国产精品av| 欧美日韩在线免费观看视频| 国产午夜久久| 日本成熟性欧美| 超级碰在线观看| 成人51免费| 国产亚洲a∨片在线观看| 91亚洲天堂| 欧美日韩国产成人在线91| 免费看av大片| 亚洲国产精品久久久久秋霞影院| 欧美白嫩的18sex少妇| 欧美一区二区福利在线| 91探花在线观看| 亚洲精品电影在线观看| 免费黄色片在线观看| 大荫蒂欧美视频另类xxxx| 色婷婷成人在线| 久久奇米777| 久久男人资源站| 午夜精品久久久久99热蜜桃导演 | 麻豆av电影在线观看| 欧美日韩国产一区二区三区| 在线视频网站| 亚洲.国产.中文慕字在线| 国产在线观看a视频| 欧美精品粉嫩高潮一区二区| 91p九色成人| 欧美成人性色生活仑片| 9999国产精品| 三上悠亚免费在线观看| 中文字幕影音在线| 一区二区亚洲精品国产| 日韩免费看片| 狠狠色综合网站久久久久久久| 欧美三区不卡| av电影一区二区三区| 99久久久免费精品国产一区二区| 日韩人妻精品无码一区二区三区| 亚洲一区二区在线播放相泽| cao在线视频| 国产精品99免视看9| 国产综合久久久久久久久久久久| 色婷婷综合久久久久中文字幕| 色8久久人人97超碰香蕉987| 欧美私密网站| 不卡一卡2卡3卡4卡精品在| 色久优优欧美色久优优| 成人超碰在线| 亚洲最大av在线| 麻豆国产一区二区| 黄色av电影在线观看| 国产精品免费久久久| 日本女优在线视频一区二区| 直接在线观看的三级网址| 国产精品亚洲四区在线观看| 国产欧美丝祙| 亚洲人成网站精品片在线观看| 日韩精品中文在线观看| 成人欧美一区二区| 污版网站在线观看| 88xx成人网| 日韩精品91亚洲二区在线观看| 91综合在线| 欧美国产亚洲一区| 中文字幕9999| 好看的av在线不卡观看| 亚洲夂夂婷婷色拍ww47| 国产无限制自拍|