国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架 原創(chuàng)

發(fā)布于 2025-10-15 09:40
瀏覽
0收藏

下面再看一個(gè)思路,圍繞解決在視覺豐富文檔(VRDs,如含圖表、多頁報(bào)告、幻燈片的PDF)理解的缺陷:

  1. 丟失布局與結(jié)構(gòu)上下文:傳統(tǒng)RAG將文檔拆分為孤立塊(如段落)嵌入,忽略跨頁依賴(如“章節(jié)標(biāo)題-后續(xù)內(nèi)容”關(guān)聯(lián))和布局層級(如“圖表-標(biāo)題-注釋”的視覺關(guān)聯(lián)),易漏檢關(guān)鍵證據(jù)。
  2. 過度依賴語義嵌入:僅通過文本/圖像嵌入的相似度檢索,無法處理依賴符號(hào)/結(jié)構(gòu)線索的查詢(如“統(tǒng)計(jì)所有源自Pew研究中心的圖表”)——這類查詢需聚合“圖表類型+來源標(biāo)注”等顯式結(jié)構(gòu)信息,而嵌入無法捕捉此類細(xì)節(jié)。
  3. top-k檢索:固定檢索數(shù)量(如top-5/10),不適應(yīng)查詢復(fù)雜度(例:“介紹3個(gè)組織”僅需3頁,“統(tǒng)計(jì)荷蘭位置圖片”需12頁),導(dǎo)致“證據(jù)不足”或“噪聲過多”。

LAD-RAG 通過以下方式解決傳統(tǒng) RAG 在VRD 中的三個(gè)關(guān)鍵局限性:

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

二、LAD-RAG框架

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

LAD-RAG 框架流程:在信息攝取階段,大型視覺語言模型從每頁文檔中提取要素并編碼至索引系統(tǒng),同時(shí)構(gòu)建捕獲頁面間與頁面內(nèi)關(guān)聯(lián)的文檔關(guān)系圖以支持符號(hào)檢索。在推理階段,智能體解析問題并循環(huán)交互神經(jīng)網(wǎng)絡(luò)索引與文檔關(guān)系圖,從而檢索相關(guān)證據(jù),實(shí)現(xiàn)問題感知與結(jié)構(gòu)感知的雙重檢索機(jī)制。左:攝入階段構(gòu)建雙索引;右:推理階段LLM智能體動(dòng)態(tài)檢索

2.1、第一階段:Ingestion

攝入階段的目標(biāo)是通過“視覺語言模型(LVLM)+運(yùn)行內(nèi)存”構(gòu)建包含布局結(jié)構(gòu)和跨頁依賴的文檔表示,最終輸出“符號(hào)文檔圖”和“索引”。

2.1.1 核心步驟1:文檔元素提取與Running Memory維護(hù)

為捕捉跨頁上下文,LAD-RAG模擬人類閱讀習(xí)慣(逐頁理解+記憶累積),分兩步處理文檔:

  1. 文檔逐頁元素提取:使用GPT-4o(強(qiáng)視覺語言模型)逐頁解析VRD,提取頁面中所有本地化元素(如段落、圖表、表格、章節(jié)標(biāo)題、腳注),并為每個(gè)元素生成“自包含描述”(用于后續(xù)節(jié)點(diǎn)構(gòu)建)。
    每個(gè)元素需包含5類關(guān)鍵信息(為后續(xù)符號(hào)圖節(jié)點(diǎn)屬性做準(zhǔn)備):
  • 布局位置(如“左上”“頁腳”);
  • 元素類型(如“figure”“section_header”);
  • 顯示內(nèi)容(文本、圖表數(shù)據(jù)、表格數(shù)值);
  • 自包含摘要(脫離上下文也可理解的描述,如“2023年美國移民意愿柱狀圖,對比公眾與拉丁裔群體”);
  • 視覺屬性(字體、顏色、大小)。
  1. Running Memory(M)累積跨頁信息
    維護(hù)一個(gè)“動(dòng)態(tài)記憶庫”,類似人類閱讀時(shí)的“持續(xù)理解”,逐頁累積三類高-level信息:
  • 章節(jié)結(jié)構(gòu)(如“1. 引言 → 1.1 研究背景”的層級);
  • 實(shí)體提及(如反復(fù)出現(xiàn)的“Pew研究中心”“大數(shù)據(jù)轉(zhuǎn)型案例”);
  • 主題進(jìn)展(如“從‘問題提出’到‘案例分析’的邏輯流”)。
    當(dāng)處理新頁面時(shí),通過內(nèi)存關(guān)聯(lián)新元素與歷史信息(如“新圖表屬于第2章案例分析”),為后續(xù)跨頁邊的構(gòu)建提供依據(jù)。
2.1.2 核心步驟2:構(gòu)建符號(hào)文檔圖(G)

符號(hào)文檔圖是將文檔的“結(jié)構(gòu)與布局關(guān)系"圖的構(gòu)成如下:

組成

具體設(shè)計(jì)

作用

節(jié)點(diǎn)(Nodes)

每個(gè)節(jié)點(diǎn)對應(yīng)1個(gè)頁面元素(如1個(gè)圖表、1個(gè)段落),屬性即3.1中提取的“布局位置、元素類型、摘要”等信息

實(shí)現(xiàn)“細(xì)粒度檢索”(如僅檢索所有“figure”節(jié)點(diǎn))

邊(Edges)

連接節(jié)點(diǎn)的兩類關(guān)系:
1. 引用關(guān)系(如“段落引用圖表”“腳注引用章節(jié)”);
2. 布局/結(jié)構(gòu)關(guān)系(如“元素屬于同一章節(jié)”“跨頁延續(xù)的附錄內(nèi)容”)

捕捉跨元素/跨頁依賴,支持“結(jié)構(gòu)化檢索”(如“找到附錄A的所有延續(xù)頁面”)

邊的構(gòu)建依賴“運(yùn)行內(nèi)存”——例如,內(nèi)存中記錄“第22頁‘附錄A’是章節(jié)層級的葉子節(jié)點(diǎn)”,處理第23頁時(shí),通過內(nèi)存識(shí)別“第23頁內(nèi)容是附錄A的延續(xù)”,并建立“第22頁附錄節(jié)點(diǎn)→第23頁附錄節(jié)點(diǎn)”的“continues”邊。

2.1.3 核心步驟3:神經(jīng)-符號(hào)雙索引存儲(chǔ)

攝入階段的最終輸出是兩類互補(bǔ)索引,為推理階段的多模態(tài)檢索提供基礎(chǔ):

  1. 符號(hào)索引(G):即完整的文檔圖對象,存儲(chǔ)節(jié)點(diǎn)/邊的顯式結(jié)構(gòu)屬性(如“元素類型=figure”“邊類型=continues”),支持“基于規(guī)則的結(jié)構(gòu)化查詢”(如“篩選所有屬于第3章且引用圖表的段落”)。
  2. 神經(jīng)索引(E):對所有節(jié)點(diǎn)的“自包含摘要”進(jìn)行向量嵌入(如用E5/BGE模型),構(gòu)建向量數(shù)據(jù)庫,支持“基于語義相似度的檢索”(如“找到與‘大數(shù)據(jù)轉(zhuǎn)型案例’語義相似的節(jié)點(diǎn)”)。

雙索引避免傳統(tǒng)RAG僅依賴嵌入的局限,也避免純符號(hào)檢索缺乏語義理解的問題。

相關(guān)提示詞:

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

用于提取文檔圖結(jié)點(diǎn)的提示。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

用于跨文檔頁面構(gòu)建和更新運(yùn)行記憶的提示。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

用于文檔圖譜構(gòu)建的攝取過程中所使用的提示

2.2、第二階段:推理——LLM智能體動(dòng)態(tài)檢索證據(jù)

推理階段的目標(biāo)是通過LLM智能體(仍基于GPT-4o)動(dòng)態(tài)交互雙索引,根據(jù)查詢需求自適應(yīng)選擇檢索策略,直到收集到“完整且低噪聲”的證據(jù)。

這里文章核心的介紹了LLM智能體與三大檢索工具。

智能體的核心能力是“理解查詢需求→選擇檢索工具→迭代優(yōu)化證據(jù)集”,其可調(diào)用三類工具(對應(yīng)不同檢索場景):

工具名稱

功能

適用場景

NeuroSemanticSearch

向神經(jīng)索引(E)發(fā)送查詢,返回語義相似度最高的節(jié)點(diǎn)(如“檢索‘大數(shù)據(jù)轉(zhuǎn)型案例’相關(guān)節(jié)點(diǎn)”)

查詢依賴語義理解(無顯式結(jié)構(gòu)要求)

SymbolicGraphQuery

向符號(hào)索引(G)發(fā)送結(jié)構(gòu)化查詢,篩選符合屬性/關(guān)系的節(jié)點(diǎn)(如“篩選所有‘type=figure’且‘屬于第2章’的節(jié)點(diǎn)”)

查詢依賴結(jié)構(gòu)/符號(hào)線索(如“統(tǒng)計(jì)特定來源的圖表數(shù)量”)

Contextualize

輸入1個(gè)節(jié)點(diǎn),基于文檔圖的“社區(qū)檢測”(Louvain算法)擴(kuò)展其“結(jié)構(gòu)鄰近節(jié)點(diǎn)”(如“輸入‘附錄A’節(jié)點(diǎn),擴(kuò)展所有屬于同一社區(qū)的附錄延續(xù)節(jié)點(diǎn)”)

需補(bǔ)充節(jié)點(diǎn)的上下文(如“找到與目標(biāo)節(jié)點(diǎn)相關(guān)的所有章節(jié)內(nèi)容”)

社區(qū)檢測細(xì)節(jié):Louvain算法會(huì)將文檔圖中“結(jié)構(gòu)/語義高度關(guān)聯(lián)的節(jié)點(diǎn)”聚類為“社區(qū)”(如“第3章的所有圖表+段落+標(biāo)題”構(gòu)成一個(gè)社區(qū)),Contextualize工具通過調(diào)用社區(qū)信息,快速擴(kuò)展出“完整的上下文證據(jù)”,避免漏檢。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

這一階段提示詞

實(shí)驗(yàn)性能

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

各模型在不同檢索類型(經(jīng) topk 調(diào)整:證據(jù)數(shù)量與 LAD-RAG 相同)及 top-k 下的準(zhǔn)確率得分。 單/多參考分別指需要單頁或多頁證據(jù)的問題。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

案例研究顯示,LAD-RAG 成功檢索出所有對比普通大眾與拉丁裔/西班牙裔群體的圖表。傳統(tǒng)語 義檢索器不僅遺漏大量相關(guān)圖表,還會(huì)混入無關(guān)內(nèi)容,而 LAD-RAG 則動(dòng)態(tài)選擇符號(hào)檢索方案:先篩選 所有圖形結(jié)點(diǎn),再利用周邊布局進(jìn)行語境化分析,最終判定是否符合查詢要求。這種基于圖譜引導(dǎo)的多步 驟流程實(shí)現(xiàn)了精準(zhǔn)且完備的證據(jù)收集。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

案例研究展示 LAD-RAG 檢索多頁參考文獻(xiàn)的過程。當(dāng)語義搜索僅能定位參考文獻(xiàn)首頁時(shí),因語義 重疊較弱而遺漏后續(xù)內(nèi)容,LAD-RAG 動(dòng)態(tài)切換至基于圖形的上下文關(guān)聯(lián)技術(shù),成功恢復(fù)所有結(jié)構(gòu)相關(guān) 的結(jié)點(diǎn),實(shí)現(xiàn)完整證據(jù)覆蓋。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

MMLongBench-Doc 問答準(zhǔn)確率細(xì)分。

多模態(tài)文檔類“GraphRAG”框架實(shí)現(xiàn)思路-LAD-RAG框架-AI.x社區(qū)

在 LongDocURL 上的問答準(zhǔn)確率細(xì)分

參考文獻(xiàn):LAD-RAG: Layout-aware Dynamic RAG for Visually-Rich Document Understanding,https://arxiv.org/pdf/2510.07233v1

本文轉(zhuǎn)載自????大模型自然語言處理??   作者:余俊暉

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产精品magnet| 亚洲国产va精品久久久不卡综合| 亚洲曰韩产成在线| 欧美成ee人免费视频| 浪潮色综合久久天堂 | 97视频热人人精品| 久久精品 人人爱| 亚洲国产黄色片| av片在线看| 第一福利永久视频精品 | 影音先锋日韩资源| 欧美专区中文字幕| 成人免费观看49www在线观看| 亚洲国产精品99| av在线免费观看网| 国产精品天美传媒| 精品国产一区二区三区无码| 日本欧美一区二区三区| 国产精品视频公开费视频| 免费日韩一区二区三区| 欧美激情第6页| 国产热re99久久6国产精品| 日本久久久a级免费| 欧美黄色性生活| 看黄网站在线观看| av中文字幕在线看| 国产一区二区三区综合| 国产亚洲精品7777| 国产一区欧美二区三区| 欧美一级大片| 亚洲人成在线一二| 手机在线理论片| 国产精品久久天天影视| 57pao成人永久免费视频| 欧美日韩亚洲一区三区| caoporn97免费视频公开| 欧美电影精品一区二区| 欧美三级午夜理伦三级小说| 亚洲中文字幕无码专区| 在线色欧美三级视频| 日本在线不卡视频| 九色视频网站在线观看| 欧美激情一区二区三区成人| 综合一区在线| 91黄色精品| h视频网站在线观看| 91精品国产综合久久久久久久| 国产精品调教视频| 亚洲制服欧美久久| 亚洲同性同志一二三专区| 福利片在线看| 国产精品视频一| 久久综合狠狠综合| 制服黑丝国产在线| 欧美在线|欧美| 波多野结衣在线播放| 亚洲国产成人在线视频| 91麻豆免费看片| 亚洲一二av| 91久久综合亚洲鲁鲁五月天| 黄色资源网久久资源365| 久久久久久久有限公司| 国产精品x8x8一区二区| 91超碰这里只有精品国产| av中文在线资源| 国产精品av在线| 麻豆精品久久精品色综合| 在线看中文字幕| 国产一区91精品张津瑜| 动漫av网站免费观看| 亚洲欧美日韩久久久久久| 米奇777在线欧美播放| 国产区美女在线| aaa免费在线观看| 亚洲激情视频在线播放| 日本欧美韩国一区三区| free性欧美| 五月天在线免费视频| 欧美高清视频一二三区 | 青娱乐极品盛宴一区二区| 欧美激情网站在线观看| 亚洲激情av| 无码少妇一区二区三区芒果| 亚洲激情自拍视频| 黄色在线看片| 亚洲精品中文字幕乱码三区不卡| 亚洲精品国产动漫| 岛国视频一区免费观看| 91在线小视频| 黄色在线播放网站| 日韩av电影在线免费播放| 国产乱国产乱300精品| 福利在线午夜| 青青草原成人在线视频| 成人精品视频一区| 国产精品刘玥久久一区| 国产精品视频内| 中文字幕精品三区| 日韩毛片一区| 四虎影院一区二区三区 | 四虎国产精品成人免费影视| 久久精品日产第一区二区三区精品版| 亚洲欧洲av一区二区三区久久| 老司机深夜福利在线观看| 亚洲在线观看视频| 亚洲精品乱码久久久久| 亚洲精品成人一区| 日本中文字幕一级片| 日韩一区二区三区视频| 欧美精品一区二区三区久久久竹菊| xx欧美撒尿嘘撒尿xx| 亚洲一区二区黄| 国产综合色产在线精品| 天堂av在线电影| 欧美精品一区二区三区在线四季 | 亚洲最黄网站| 欧美理论在线观看| 国产精品电影网| 中文字幕av免费专区久久| 日本欧美一区| 一本大道东京热无码aⅴ| 精品粉嫩aⅴ一区二区三区四区| 黑人一区二区| 久草视频在线看| 3d动漫精品啪啪一区二区三区免费 | 69影院欧美专区视频| 97久久精品人人做人人爽50路| 国产丝袜精品丝袜| 日本成人黄色| 欧美一区二区三区视频| 欧美日韩亚洲一区在线观看| 国内av一区二区三区| 欧美精品成人一区二区三区四区| 亚洲三级视频| 欧美亚洲国产成人| 久久婷婷国产麻豆91天堂| 26uuu国产电影一区二区| 精品国产麻豆| 污网站免费在线| 欧美在线视频a| 亚洲一区二区三区四区在线| 成人三级视频| 深夜福利视频一区| 国产精品国模大尺度私拍| 欧美日本一区二区三区| 免费在线观看成人av| hd国产人妖ts另类视频| 中文字幕第50页| 北条麻妃久久精品| 中文在线一区二区| jiujiure精品视频播放| 欧美性孕妇孕交| 欧美三级网色| 日韩精品丝袜在线| 99九九99九九九视频精品| 丁香五月缴情综合网| 日本私人影院在线观看| 国产精品初高中精品久久| 精品国产91亚洲一区二区三区婷婷| 国产真实乱偷精品视频免| 国产精品国产亚洲精品| 国产女呦网站| 成人羞羞视频免费| 日韩成人中文字幕| 久久久久一区二区三区四区| 欧美男gay| av片哪里在线观看| 黄色大片在线免费看| 欧美一级免费看| 在线视频中文字幕一区二区| 久久超级碰视频| 国产精品毛片视频| 国产大片在线免费观看| 久久久久久久久影视| 2023亚洲男人天堂| 欧美日韩综合在线免费观看| 国产v日产∨综合v精品视频| 秋霞影视一区二区三区| 一级毛片视频在线| 能在线观看的av| 91免费看片网站| 国产一区二区三区日韩欧美| 亚洲电影第三页| 久久国产精品色婷婷| 欧美日韩有码| 2020国产在线| 在线黄色国产电影| 亚洲亚洲精品三区日韩精品在线视频| 久久久久亚洲精品成人网小说| 制服丝袜亚洲色图| 国产精品女上位| 久久国产精品99久久人人澡| av一区二区在线观看| 国产一区二区主播在线| 精品久久av| 成人三级av| 18黄暴禁片在线观看| 精品国产乱码久久久久久蜜柚 | 久久久久9999亚洲精品| 亚洲精品麻豆|