国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

劍橋團隊開源:賦能多模態大模型RAG應用,首個預訓練通用多模態后期交互知識檢索器

人工智能 新聞
PreFLMR模型是一個通用的預訓練多模態知識檢索器,可用于搭建多模態RAG應用。模型基于發表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并進行了模型改進和 M2KR 上的大規模預訓練。

圖片



  • 論文鏈接:https://arxiv.org/abs/2402.08327
  • DEMO 鏈接:https://u60544-b8d4-53eaa55d.westx.seetacloud.com:8443/
  • 項目主頁鏈接:https://preflmr.github.io/
  • 論文標題:PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers

背景

盡管多模態大模型(例如 GPT4-Vision、Gemini 等)展現出了強大的通用圖文理解能力,它們在回答需要專業知識的問題時表現依然不盡人意。即使 GPT4-Vision 也無法回答知識密集型問題(圖一上),這成為了很多企業級落地應用的瓶頸。

圖 1:GPT4-Vision 在 PreFLMR 多模態知識檢索器的幫助下可以獲得相關知識,生成正確的答案。圖中展示了模型的真實輸出。

針對這個問題,檢索增強生成(RAG,Retrieval-Augmented Generation)提供了一個簡單有效的讓多模態大模型成為” 領域專家” 的方案:首先,一個輕量的知識檢索器(Knowledge Retriever)從專業數據庫(例如 Wikipedia 或企業知識庫)中獲得相關的專業知識;然后,大模型將這些知識和問題一起作為輸入,生成準確的答案。多模態知識提取器的知識 “召回能力” 直接決定了大模型在回答推理時能否獲得準確的專業知識。

近期,劍橋大學信息工程系人工智能實驗室完整開源了首個預訓練、通用多模態后期交互知識檢索器 PreFLMR (Pre-trained Fine-grained Late-interaction Multi-modal Retriever)。相比以往常見的模型,PreFLMR 有以下特點:

1.PreFLMR 是一個可以解決文文檢索,圖文檢索,知識檢索等多個子任務的通用預訓練模型。該模型經過百萬級的多模態數據預訓練后,在多個下游檢索任務中取得了優秀的表現。同時,作為一個優秀的基底模型,PreFLMR 在私有數據上稍加訓練就能夠獲得表現極佳的領域專用模型。

圖 2:PreFLMR 模型同時在多項任務上取得極佳的多模態檢索表現,是一個極強的預訓練基底模型。

2. 傳統的密集文本檢索(Dense Passage Retrieval, DPR)只使用一個向量表征問詢(Query)或文檔(Document)。劍橋團隊在 NeurIPS 2023 發表的 FLMR 模型證明了 DPR 的單向量表征設計會導致細粒度信息損失,導致 DPR 在需要精細信息匹配的檢索任務上表現不佳。尤其是在多模態任務中,用戶的問詢(Query)包含復雜場景信息,壓縮至一維向量極大抑制了特征的表達能力。PreFLMR 繼承并改進了 FLMR 的結構,使其在多模態知識檢索中有得天獨厚的優勢。

圖片

圖 3:PreFLMR 在字符級別(Token level)上編碼問詢(Query,左側 1、2、3)和文檔(Document,右側 4),相比于將所有信息壓縮至一維向量的 DPR 系統有信息細粒度上的優勢。

3.PreFLMR 能夠根據用戶輸入的指令(例如 “提取能用于回答以下問題的文檔” 或 “提取與圖中物品相關的文檔”),從龐大的知識庫中提取相關的文檔,幫助多模態大模型大幅提升在專業知識問答任務上的表現。

圖片


圖片

圖 4:PreFLMR 可以同時處理圖片提取文檔、根據問題提取文檔、根據問題和圖片一起提取文檔的多模態問詢任務。

劍橋大學團隊開源了三個不同規模的模型,模型的參數量由小到大分別為:PreFLMR_ViT-B (207M)、PreFLMR_ViT-L (422M)、PreFLMR_ViT-G (2B),供使用者根據實際情況選取。

除了開源模型 PreFLMR 本身,該項目還在該研究方向做出了兩個重要貢獻:

  1. 該項目同時開源了一個訓練和評估通用知識檢索器的大規模數據集,Multi-task Multi-modal Knowledge Retrieval Benchmark (M2KR),包含 10 個在學界中被廣泛研究的檢索子任務和總計超過百萬的檢索對。
  2. 在論文中,劍橋大學團隊對比了不同大小、不同表現的圖像編碼器和文本編碼器,總結了擴大參數和預訓練多模態后期交互知識檢索系統的最佳實踐,為未來的通用檢索模型提供經驗性的指導。

下文將簡略介紹 M2KR 數據集,PreFLMR 模型和實驗結果分析。

M2KR 數據集

為了大規模預訓練和評估通用多模態檢索模型,作者匯編了十個公開的數據集并將其轉換為統一的問題 - 文檔檢索格式。這些數據集的原本任務包括圖像描述(image captioning),多模態對話(multi-modal dialogue)等等。下圖展示了其中五個任務的問題(第一行)和對應文檔(第二行)。

圖片

圖 5:M2KR 數據集中的部分知識提取任務

PreFLMR 檢索模型

圖片

圖 6:PreFLMR 的模型結構。問詢(Query)被編碼為 Token-level 的特征。PreFLMR 對問詢矩陣中的每一個向量,找到文檔矩陣中的最近向量并計算點積,然后對這些最大點積求和得到最后的相關度。

PreFLMR 模型基于發表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并進行了模型改進和 M2KR 上的大規模預訓練。相比于 DPR,FLMR 和 PreFLMR 用由所有的 token 向量組成的矩陣對文檔和問詢進行表征。Tokens 包含文本 tokens 和投射到文本空間中的圖像 tokens。后期交互(late interaction)是一種高效計算兩個表征矩陣之間相關性的算法。具體做法為:對問詢矩陣中的每一個向量,找到文檔矩陣中的最近向量并計算點積。然后對這些最大點積求和得到最后的相關度。這樣,每個 token 的表征都可以顯式地影響最終的相關性,以此保留了 token-level 的細粒度(fine-grained)信息。得益于專門的后期交互檢索引擎,PreFLMR 在 40 萬文檔中提取 100 個相關文檔僅需 0.2 秒,這極大地提高了 RAG 場景中的可用性。

PreFLMR 的預訓練包含以下四個階段:

  • 文本編碼器預訓練:首先,在 MSMARCO(一個純文本知識檢索數據集)上預訓練一個后期交互文文檢索模型作為 PreFLMR 的文本編碼器。
  • 圖像 - 文本投射層預訓練:其次,在 M2KR 上訓練圖像 - 文本投射層并凍結其它部分。該階段只使用經過投射的圖像向量進行檢索,旨在防止模型過度依賴文本信息。
  • 持續預訓練:然后,在 E-VQA,M2KR 中的一個高質量知識密集型視覺問答任務上持續訓練文本編碼器和圖像 - 文本投射層。這一階段旨在提升 PreFLMR 的精細知識檢索能力。
  • 通用檢索訓練:最后,在整個 M2KR 數據集上訓練所有權重,只凍結圖像編碼器。同時,將問詢文本編碼器和文檔文本編碼器的參數解鎖進行分別訓練。這一階段旨在提高 PreFLMR 的通用檢索能力。

同時,作者展示了 PreFLMR 可以在子數據集(如 OK-VQA、Infoseek)上進一步微調以在特定任務上獲得更好的檢索性能。

實驗結果和縱向擴展

最佳檢索結果:表現最好的 PreFLMR 模型使用 ViT-G 作為圖像編碼器和 ColBERT-base-v2 作為文本編碼器,總計二十億參數。它在 7 個 M2KR 檢索子任務(WIT,OVEN,Infoseek, E-VQA,OKVQA 等)上取得了超越基線模型的表現。

擴展視覺編碼更加有效:作者發現將圖像編碼器 ViT 從 ViT-B(86M)升級到 ViT-L(307M)帶來了顯著的效果提升,但是將文本編碼器 ColBERT 從 base(110M)擴展到 large(345M)導致表現下降并造成了訓練不穩定問題。實驗結果表明對于后期交互多模態檢索系統,增加視覺編碼器的參數帶來的回報更大。同時,使用多層 Cross-attention 進行圖像 - 文本投射的效果與使用單層相同,因此圖像 - 文本投射網絡的設計并不需要過于復雜。

PreFLMR 讓 RAG 更加有效:在知識密集型視覺問答任務上,使用 PreFLMR 進行檢索增強大大提高了最終系統的表現:在 Infoseek 和 EVQA 上分別達到了 94% 和 275% 的效果提升,經過簡單的微調,基于 BLIP-2 的模型能夠擊敗千億參數量的 PALI-X 模型和使用 Google API 進行增強的 PaLM-Bison+Lens 系統。

結論

劍橋人工智能實驗室提出的 PreFLMR 模型是第一個開源的通用后期交互多模態檢索模型。經過在 M2KR 上的百萬級數據預訓練,PreFLMR 在多項檢索子任務中展現出強勁的表現。M2KR 數據集,PreFLMR 模型權重和代碼均可以在項目主頁 https://preflmr.github.io/ 獲取。

拓展資源

  • FLMR paper (NeurIPS 2023): https://proceedings.neurips.cc/paper_files/paper/2023/hash/47393e8594c82ce8fd83adc672cf9872-Abstract-Conference.html 
  • 代碼庫:https://github.com/LinWeizheDragon/Retrieval-Augmented-Visual-Question-Answering
  • 英文版博客:https://www.jinghong-chen.net/preflmr-sota-open-sourced-multi/
  • FLMR 簡介:https://www.jinghong-chen.net/fined-grained-late-interaction-multimodal-retrieval-flmr/
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-01-08 08:21:16

2024-10-14 14:10:00

大模型AI開源

2025-03-19 09:30:00

2024-10-29 11:54:25

2024-12-30 00:01:00

多模態大模型Python

2025-05-14 08:51:00

2025-04-07 00:00:00

多模態大模型

2025-05-26 09:49:59

多模態智能體RAG

2024-05-21 07:54:30

視頻多模態語義檢索算法

2025-12-03 08:21:33

2024-12-18 18:57:58

2024-11-13 09:39:13

2024-09-10 12:11:18

2024-12-12 00:25:09

2024-11-11 15:11:23

2024-05-27 07:21:43

2024-03-25 12:40:19

訓練模型

2025-10-30 09:23:58

點贊
收藏

51CTO技術棧公眾號

宅男噜噜99国产精品观看免费| 欧美日韩dvd在线观看| 3344国产永久在线观看视频| 国产精品劲爆视频| 2022国产精品视频| 涩涩网在线视频| 国产一区二区高清视频| 亚洲国产成人av网| 精品网站aaa| 色香蕉在线观看| 8x8x8国产精品| 欧美日韩岛国| 青青草视频在线免费观看| 国产成人极品视频| 国产精品免费看片| 日韩精品视频在线看| 2018中文字幕第一页| 日韩av最新在线| 亚洲福利国产| 免费在线黄色影片| 成人亚洲综合色就1024| 亚洲视频香蕉人妖| 99国产精品久久一区二区三区| 一本大道熟女人妻中文字幕在线| 在线成人中文字幕| 成人免费视频播放| 四虎国产精品免费久久| 高清无码视频直接看| 国产香蕉精品视频一区二区三区| 日本sm残虐另类| 天堂va在线| 欧美日韩精品综合| 日韩免费电影网站| 免费成人av在线| 国产不卡123| 国产精品夜夜夜爽张柏芝| 亚洲第一偷拍网| 激情成人午夜视频| 日韩欧美2区| 国产精品沙发午睡系列| 欧美成年人网站| 国产精品伦理在线| 欧美精品一二| 黄色的视频在线免费观看| 999国产视频| 欧美精品乱人伦久久久久久| 老司机精品视频网站| 国产网站在线| 欧美乱大交xxxxx潮喷l头像| 精品久久久91| 国产精品毛片a∨一区二区三区| 国产成人精品一区二区免费看京| 最新中文在线视频| 韩日午夜在线资源一区二区| 亚洲成人av在线播放| 岛国精品在线观看| 国偷自产av一区二区三区| 影音先锋导航| 99理论电影网| 日韩av在线影院| 久久久久一区二区三区四区| 美日韩黄色大片| 污网站在线观看视频| 亚洲国产精品123| 久久噜噜噜精品国产亚洲综合 | av资源在线观看免费高清| 亚洲第一页在线视频| 欧美亚洲伦理www| 91精品国产麻豆国产自产在线| 91好吊色国产欧美日韩在线| 国产一区二区三区在线| 欧美国产精品专区| 红桃视频欧美| 成人不卡视频| 亚洲男人资源| 国产资源在线免费观看| 国产有码一区二区| 亚洲午夜国产成人av电影男同| 亚洲理论在线观看| 久久国产人妖系列| 欧美热在线视频精品999| 亚洲综合图区| 福利视频午夜| 成人免费看片视频在线观看| 国产精品久久久久秋霞鲁丝| 日韩精品免费在线视频| 一区二区三区精品| 激情综合色播五月| 91蜜臀精品国产自偷在线| 香蕉视频亚洲一级| 国际av在线| 亚洲色图久久久| 亚洲巨乳在线观看| 国产色综合天天综合网 | 欧美日韩中文字幕一区| 成人激情动漫在线观看| 欧美粗暴jizz性欧美20| 欧美大陆国产| 黄网址在线观看| eeuss在线播放| 91xxx视频| 鬼打鬼之黄金道士1992林正英| 欧美成在线视频| 欧美精品一区二区蜜臀亚洲| 婷婷夜色潮精品综合在线| 99久久国产综合精品色伊| 免费在线亚洲| 亚洲精品亚洲人成在线观看| 亚洲最新无码中文字幕久久| 国模吧精品人体gogo| 欧美午夜aaaaaa免费视频| 亚洲欧美日韩另类精品一区二区三区| 日本a级片电影一区二区| 亚洲人成在线免费观看| 欧美日韩国产中文| 亚洲高清中文字幕| 久久综合九色综合欧美亚洲| 奇米色777欧美一区二区| 91不卡在线观看| 网友自拍区视频精品| 先锋欧美三级| 在线观看的网站你懂的| 日本天堂在线| 麻豆福利视频| 亚洲爆乳无码专区| 亚洲乱码日产精品bd在线观看| 狠狠色噜噜狠狠色综合久| 国产成+人+综合+亚洲欧洲 | 日韩精品一二三区| 婷婷综合网站| 五月综合久久| 亚洲成av人片在线观看www| 色尼玛亚洲综合影院| av网站免费在线观看| 水莓100国产免费av在线播放| 免费一区二区三区在线观看| 激情小视频网站| 国产高清免费在线| 天天爽天天狠久久久| 99伊人久久| 亚洲一区二区三区久久 | 欧美精品videossex88| 亚洲午夜色婷婷在线| 亚洲国产古装精品网站| 欧美在线视频你懂得| 欧美日韩美女在线观看| 亚洲专区一二三| 一区二区免费在线| 亚洲精品自拍动漫在线| 国产精品伦理一区二区| 国产精品欧美一区二区三区| 国产色综合久久| 国产欧美一二三区| 国产欧美日韩不卡| 国产精品久久久久久久久果冻传媒 | 日本一区二区三区在线不卡 | 欧美日韩亚洲不卡| 色一区在线观看| 欧美日韩国产中字| 亚洲va欧美va人人爽午夜 | 日韩人体视频| 午夜精品福利影院| 亚洲欧洲美洲国产香蕉| 久久99性xxx老妇胖精品| 妖精视频一区二区三区免费观看 | 能在线观看的av| 99re在线视频免费观看| www.日日操| sm一区二区三区| 香蕉av一区| 午夜伦全在线观看| 18视频在线观看| 瑟瑟视频在线看| 国产a亚洲精品| 91午夜精品| 国产日韩视频在线| 91精品久久久久久久蜜月| 黄色av日韩| 麻豆精品精品国产自在97香蕉 | 无码av中文一区二区三区桃花岛| 亚洲福利一二三区| 色婷婷综合久色| 日韩欧美精品三级| 亚洲视频网站在线观看| 中文字幕在线视频日韩| 97超碰色婷婷| 91亚洲精华国产精华| 玖玖玖精品中文字幕| 久久久久福利视频| 伊人国产在线视频| 亚洲女人天堂在线| 羞羞视频在线观看免费| 欧洲成人一区| 青青久久av| 国一区二区在线观看| 精品一二线国产| 国产精品国产三级国产| 欧美主播一区二区三区美女| 精品亚洲永久免费精品| 久久久久久尹人网香蕉|