国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%

發布于 2025-4-14 23:56
瀏覽
0收藏

文檔問答太難了 

含有豐富文本和視覺元素(如圖表、圖像等)的長文檔,在進行文檔問答時,現有的方案有其局限性:

  • 傳統的大型語言模型(LLMs)僅能處理文本信息
  • 大型視覺語言模型(LVLMs)雖然能夠處理視覺內容,但在處理長文檔時往往效率低下,并且難以對文本和視覺信息進行有效的融合與推理。
  • 現有的檢索增強生成(RAG)方法雖然能夠從長文檔中提取關鍵信息,但它們通常僅依賴于單一模態(文本或圖像)進行檢索,缺乏跨模態的信息整合能力。

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%-AI.x社區

MDocAgent 

5個智能體

MDocAgent通過引入多個專門的智能體(agents),協同處理文本和圖像信息,以實現對文檔內容的深入理解。 具體而言,MDocAgent 包含以下五個智能體:

  • 通用智能體(General Agent):負責初步的多模態信息整合,為后續的分析提供基礎。
  • 關鍵信息提取智能體(Critical Agent):識別并提取對回答問題至關重要的文本和視覺信息,為其他智能體提供指導。
  • 文本智能體(Text Agent):專注于文本信息的分析,從文本中提取與問題相關的細節。
  • 圖像智能體(Image Agent):專注于圖像信息的分析,從圖像中提取與問題相關的視覺細節。
  • 總結智能體(Summarizing Agent):綜合所有智能體的輸出,生成最終的答案。

MDocAgent架構

  • MDocAgent 通過多模態多智能體的協同工作,實現對文檔內容的全面理解。
  • 該框架不僅關注文本和圖像信息的獨立分析,還強調跨模態信息的融合與推理。
  • 通過將文檔預處理、多模態上下文檢索、關鍵信息提取、專門智能體處理以及答案合成等步驟有機結合,MDocAgent 能夠在復雜的文檔環境中,精準地定位和整合關鍵信息,從而生成準確的答案。

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%-AI.x社區

  • 文檔預處理:

a.文檔預處理的目的是,將文檔轉換為適合后續分析的格式。

b.對于文檔中的每一頁,使用 OCR 技術識別圖像中的文本內容,同時通過 PDF 解析技術提取數字化文本。

c.將提取的文本表示為文本段落序列,每個段落包含一頁中的部分或全部文本。

d.同時,將每一頁的原始圖像保留下來,以便后續的視覺分析。

  • 多模態上下文檢索:

a.多模態上下文檢索階段的目標是,從文檔中檢索與問題最相關的文本和圖像信息。

b.使用 ColBERT 對文檔中的文本段落進行索引,并根據問題檢索出最相關的文本段落。

c.使用 ColPali 對文檔中的圖像頁面進行處理,生成視覺嵌入向量,并根據問題檢索出最相關的圖像頁面。

d.通過比較文本和圖像的相關性得分,選擇最相關的文本段落和圖像頁面作為后續分析的上下文。

e.這一階段通過結合文本和圖像檢索,為后續的智能體分析提供了豐富的上下文信息。

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%-AI.x社區

  • 關鍵信息提取:

a.關鍵信息提取階段目的是,從檢索到的上下文中提取對回答問題至關重要的信息。

b.通用智能體對檢索到的文本和圖像信息進行初步分析,生成初步答案。

c.關鍵信息提取智能體則進一步分析這些信息,提取出對回答問題至關重要的文本和視覺信息。

d.提取的關鍵信息將作為后續專門智能體處理的輸入,指導它們的分析過程。

e.這一階段通過提取關鍵信息,為后續的專門智能體處理提供明確的指導,提高系統的效率和準確性。

  • 專門智能體處理:

a.專門智能體處理的目的是,對提取的關鍵信息進行深入分析。

b.文本智能體接收提取的關鍵文本信息和相關的文本上下文,通過分析文本內容,生成詳細的文本答案。

c.圖像智能體接收提取的關鍵視覺信息和相關的圖像上下文,通過分析圖像內容,生成詳細的視覺答案。

d.文本智能體和圖像智能體分別從文本和圖像的角度對問題進行分析,生成的答案將作為后續答案合成階段的輸入。

e.這一階段通過專門智能體的協同工作,實現對文本和圖像信息的深入分析,為最終答案的生成提供了豐富的依據。

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%-AI.x社區

  • 答案合成:

a.答案合成階段目的是,綜合所有智能體的輸出,生成最終的答案。

b.總結智能體接收來自通用智能體、文本智能體和圖像智能體的答案。

c.總結智能體分析這些答案,識別其中的共同點、差異和互補信息。

d.總結智能體根據這些分析結果,生成一個綜合性的答案,該答案不僅考慮了文本和圖像信息,還考慮了它們之間的關系。

e.這一階段通過綜合分析所有智能體的輸出,生成了一個全面且準確的答案。

MDocAgent方案VS M3DocRAG & ColBERT+Llama3.1 

案例1

  • 要求比較文檔中兩個不同拉丁裔群體的人口數量:外國出生的拉丁裔和通過手機采訪的拉丁裔。
  • 文檔中包含了相關的文本描述和表格數據,但這些信息分散在不同的位置,需要同時從文本和圖像中提取并整合。

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%-AI.x社區

  • 檢索階段:

a.ColBERT 和 ColPali 成功檢索到了包含相關信息的頁面,但僅檢索到頁面是不夠的,還需要進一步分析頁面中的具體內容。

b.ColBERT:僅依賴文本信息,未能準確解析文本中的數值數據,錯誤地得出“外國出生的拉丁裔人口更多”的結論。

c.M3DocRAG:雖然結合了文本和圖像信息,但由于缺乏對關鍵信息的細致提取和跨模態整合能力,未能正確回答問題。

d.MDocAgent 通過多模態上下文檢索,同時利用文本和圖像信息,避免了單一模態方法的局限性。

  • 初步分析與關鍵信息提?。?/li>

a.通用智能體(General Agent)生成了一個初步但較為模糊的答案,指出“通過手機采訪的拉丁裔人口更多”。

  • 關鍵信息提取智能體(Critical Agent)識別出關鍵信息,包括文本中的“外國出生(排除波多黎各)”和圖像中的“手機抽樣框架”表格。
  • 專門智能體處理:

a.文本智能體(Text Agent)根據關鍵信息提取智能體提供的線索,從文本中提取到“外國出生(排除波多黎各)的人數為 795”。

b.圖像智能體(Image Agent)從表格中提取到“通過手機采訪的人數為 1051”。

  • 答案合成:

a.總結智能體(Summarizing Agent)整合所有智能體的輸出,生成最終答案:“通過手機采訪的拉丁裔人數(1051)大于外國出生的拉丁裔人數(795)”。

案例2:

  • 要求從一個列表中識別出唯一一個沒有包含人員的相應圖像的原因。
  • 文檔中包含了一個關于 NTU 智慧校園的列表,但列表沒有明確編號,且每個原因旁邊都有相應的圖像。
  • 檢索階段:

a.ColBERT 未能檢索到正確的證據頁面,導致 ColBERT + Llama-3.1-8B 無法回答問題。

b.ColPali 成功檢索到了包含證據的頁面,但由于缺乏對關鍵信息的細致提取和跨模態整合能力,未能正確回答問題。

c.MDocAgent 通過多模態檢索,成功定位到包含關鍵信息的頁面。

  • 初步分析與關鍵信息提?。?/li>

a.通用智能體(General Agent)生成了一個初步答案,但未能準確識別。

b.關鍵信息提取智能體(Critical Agent)識別出關鍵文本線索“Most Beautiful Campus”和相應的視覺元素(NTU 校園的圖像)。

  • 專門智能體處理:

a.文本智能體(Text Agent)根據關鍵信息提取智能體提供的線索,嘗試從文本中找到相關信息,但由于文本中沒有明確的列表編號,未能直接找到答案。

b.圖像智能體(Image Agent)利用關鍵信息,正確識別出“NTU campus without people”作為答案。

  • 答案合成:

a.總結智能體(Summarizing Agent)綜合所有智能體的輸出,最終確定答案為“Most Beautiful Campus”,并指出該原因的圖像中沒有人員

案例3:

  • 要求從文檔中識別出 Professor Lebour 的學位。
  • 文檔中包含相關文本描述和圖像,但信息分散在不同的位置,需要同時從文本和圖像中提取并整合。

Adobe首發多Agent、跨模態框架MDocAgent:復雜文檔理解性能爆炸12%,錯誤率直降21%-AI.x社區

  • 檢索階段:

a.ColBERT 成功檢索到了包含相關信息的頁面,但 ColBERT + Llama-3.1-8B 在生成答案時錯誤地將 “F.G.S.” 識別為一個學位,導致答案不準確。

b.ColPali 未能檢索到正確的頁面,導致 M3DocRAG 無法回答問題。

c.MDocAgent 通過多模態檢索,成功定位到包含關鍵信息的頁面。

  • 初步分析與關鍵信息提取:

a.通用智能體(General Agent)生成了一個初步答案,但未能準確識別所有信息,錯誤地將 “F.G.S.” 識別為一個學位。

b.關鍵信息提取智能體(Critical Agent)識別出關鍵文本線索 “M.A.”,并從圖像中提取了相關的視覺線索。

  • 專門智能體處理:

a.文本智能體(Text Agent)根據關鍵信息提取智能體提供的線索,從文本中提取到 “G. A. Lebour, M.A., F.G.S.”,并確認 “M.A.” 是一個學位。

b.圖像智能體(Image Agent)利用關鍵信息,確認圖像中沒有提供額外的學位信息,但支持文本中的 “M.A.”。

  • 答案合成:

a.總結智能體(Summarizing Agent)綜合所有智能體的輸出,最終確定答案為 “Prof. Lebour holds a Master of Arts (M.A.) degree.”。

??https://arxiv.org/pdf/2503.13964??

??https://github.com/aiming-lab/MDocAgent??

本文轉載自??CourseAI??,作者:CourseAI

已于2025-4-15 09:43:43修改
收藏
回復
舉報
回復
相關推薦
欧洲在线视频| 午夜精品久久久久99热蜜桃导演 | 幼a在线观看| 日韩大片在线| 亚洲欧美一区二区三区四区 | 欧美精品久久久| 国内视频在线精品| 精品视频在线播放免| 欧洲一级在线观看| 精品久久久久久久| 亚洲女人天堂av| av片在线看| 亚洲久草在线视频| 91超碰caoporn97人人| 超碰97国产精品人人cao| 亚洲午夜av在线| 欧美极品欧美精品欧美图片| 日本午夜精品一区二区三区电影| 91视频国产一区| 污视频免费在线看| 亚洲欧美综合久久久| 欧美乱妇高清无乱码| 成人自拍av| 亚洲成人动漫在线播放| 欧美私人网站| 欧美精品亚洲二区| av播放在线| 欧美人动与zoxxxx乱| 日韩亚洲视频在线| 欧美黄在线观看| 国产精品视频一区二区高潮| 免费在线超碰| 一区二区三区免费在线观看| 日日干夜夜操s8| 亚洲大全视频| 国产精品视频免费在线观看| 欧美理论电影在线精品| 一区二区在线观看av| 黄色三级视频在线| 久久无码av三级| 一女被多男玩喷潮视频| 99视频精品在线| 99草草国产熟女视频在线| 91丨porny丨首页| 欧美一级黄色片视频| 337p粉嫩大胆色噜噜噜噜亚洲| 三上悠亚久久精品| 久久久.com| 99porn视频在线| 中文字幕乱码亚洲无线精品一区| 成人激情视频小说免费下载| 91精品国产乱码久久久久久| 成人自拍爱视频| 青青久久精品| 欧美精品在线极品| 久久国产精品高清一区二区三区| 青娱乐精品在线视频| 亚洲国产欧美一区二区三区不卡| 人人爽香蕉精品| 日本免费a视频| 亚洲国产高清在线| 污视频网站在线看| 欧美日韩国产小视频| 98色花堂精品视频在线观看| 国产一区二区三区在线免费观看| 最新在线地址| 在线亚洲精品福利网址导航| 国产鲁鲁视频在线观看特色| 亚洲精品大尺度| 国产一区二区三区精品在线观看| 在线亚洲欧美专区二区| v片在线观看| 久久九九国产精品怡红院| 国产精品网站在线看| 91在线网站视频| 免费看欧美美女黄的网站| 日本韩国在线不卡| 天天射天天综合网| 欧美极品少妇全裸体| 欧洲激情综合| 欧美一进一出视频| 久久午夜免费电影| yiren22亚洲综合伊人22| 亚洲人高潮女人毛茸茸| 青青草久久爱| 欧美日韩最好看的视频| 久久精品欧美日韩| 清纯唯美亚洲色图| 亚洲美女av在线| 欧美日韩中文字幕一区二区三区 | 26uuu另类欧美| 如如影视在线观看经典| 日韩欧美亚洲国产另类| 99香蕉久久| 中文欧美日本在线资源| 青青久久av| 一区二区三区四区五区精品 | 欧美乱妇15p| 国产精品1区| av一区和二区| 国产三级精品视频| 亚洲奶水xxxx哺乳期| 57pao精品| 欧美成年网站| 亚洲男人天堂网| 尤物tv在线精品| 特色特色大片在线| 在线一区二区三区四区| av在线播放一区二区| 久久久久久精| 亚洲欧美激情在线| 五月激情久久| 亚洲三级免费看| 五月天久久久| 精品中文字幕av| 日韩一区二区三区在线观看| 欧美男男freegayvideosroom| 一本色道久久综合亚洲二区三区| 老牛嫩草一区二区三区日本| 男人捅女人免费视频| 国产日韩欧美精品电影三级在线| 99精品老司机免费视频| 91黑丝在线观看| 成人午夜精品在线| 三级福利片在线观看| 国产在线观看精品一区二区三区| 99久久久久久99| 一区二区精品伦理... | 亚洲一级电影视频| 另类一区二区| 日本亚洲自拍| 欧洲日韩一区二区三区| 青青草成人影院| 羞羞免费视频网站| 九九久久久久99精品| 成人av在线一区二区三区| 成人免费观看在线观看| 亚洲国产另类 国产精品国产免费| 欧美色就是色| 成人网免费看| 97久久精品国产| 日本一区二区三区dvd视频在线| 日韩伦理三区| 日本一区二区免费高清视频| 国产ts人妖一区二区| 污网站在线免费看| 国产一区二区在线网站| 亚洲精品国产一区二区三区四区在线| 免费看日产一区二区三区| 国产免费毛卡片| 久久亚洲欧美日韩精品专区| av成人资源| 人妻少妇被粗大爽9797pw| 中文字幕av一区| 成人免费黄色大片| 国产精品字幕| 国内外成人激情视频| 精品国产欧美一区二区三区成人| 国产一区调教| 蜜臀av免费观看| 欧美国产亚洲视频| 国产亚洲精品7777| 中文字幕一区二区三区四区久久 | 一区二区欧美国产| 成人高清电影网站| 在线视频专区| 亚洲一区二区三区四区视频| 欧美午夜精品久久久久久浪潮| 久久久久久久久国产一区| 黄色毛片在线观看| 国产在线一区二| 日韩视频免费直播| 理论电影国产精品| 婷婷六月天在线| 欧美激情久久久久| 亚洲视频一区二区在线观看| 欧美色爱综合| 自拍视频在线| 中文字幕一区二区三区最新| 曰本色欧美视频在线| 国产日韩欧美一区二区三区乱码 | 欧美aaa视频| 免费看又黄又无码的网站| 欧美极度另类性三渗透| 亚洲一区二区三区视频在线| 亚洲天堂一区二区三区四区| 成年人网站在线| 免费一级特黄毛片| 狠狠色噜噜狠狠狠狠97| 欧美日韩国产网站| 黄色av免费在线播放| 国产盗摄xxxx视频xxx69| 色激情天天射综合网| 青青草伊人久久| 中文字幕一区二区三区四区久久| 最近中文字幕在线中文视频| 欧美成人免费在线| 久久久999国产| 欧美视频中文在线看| 久久成人免费网站|