国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

打破瓶頸,讓RAG學(xué)會(huì)思考:中科大、智源等發(fā)布推理檢索框架BGE-Reasoner

人工智能 新聞
BGE-Reasoner 的卓越表現(xiàn)充分驗(yàn)證了強(qiáng)化學(xué)習(xí)與合成數(shù)據(jù)在推理密集型信息檢索中的重要作用,為未來 Agent Search 的發(fā)展提供了關(guān)鍵支撐。

人工智能的浪潮正將我們推向一個(gè)由 RAG 和 AI Agent 定義的新時(shí)代。然而,要讓這些智能體真正「智能」,而非僅僅是信息的搬運(yùn)工,就必須攻克一個(gè)橫亙?cè)谒许敿鈭F(tuán)隊(duì)面前的核心難題。這個(gè)難題,就是推理密集型信息檢索(Reasoning-Intensive IR)。

它不僅是當(dāng)前 RAG 和 AI Agent 技術(shù)發(fā)展的關(guān)鍵瓶頸,更對(duì)大模型智能體和深度研究(DeepResearch)等應(yīng)用場(chǎng)景的成敗具有決定性意義。

正當(dāng)全球研究者都在為此尋求突破之際,我們看到了一項(xiàng)來自中國(guó)的貢獻(xiàn):BGE-Reasoner。

BGE-Reasoner 由來自中國(guó)科學(xué)技術(shù)大學(xué)、智源研究院、北京郵電大學(xué)與香港理工大學(xué)等機(jī)構(gòu)的聯(lián)合團(tuán)隊(duì)研發(fā),是一套用于推理密集型信息檢索任務(wù)的創(chuàng)新的端到端解決方案。通過系統(tǒng)性的查詢理解、向量檢索與重排序,該方案可顯著提升搜索引擎在推理密集型信息檢索任務(wù)中的表現(xiàn)。

在權(quán)威評(píng)測(cè)基準(zhǔn) BRIGHT 上,BGE-Reasoner 取得 45.2 的測(cè)試得分,以顯著優(yōu)勢(shì)刷新了該基準(zhǔn)的最佳紀(jì)錄。

作為 BGE 系列模型的又一重要里程碑,BGE-Reasoner 不僅實(shí)現(xiàn)了性能上的突破,更為解決推理密集型檢索這一行業(yè)難題提供了一套行之有效的新范式。從技術(shù)洞察來看,本次成果的核心創(chuàng)新主要體現(xiàn)在以下三個(gè)方面:

  1. 一個(gè)可復(fù)制的框架: 提出了一個(gè)由 Rewriter、Embedder 和 Reranker 組成的三階段模塊化框架,為處理復(fù)雜查詢提供了清晰、高效的工程范式。
  2. 數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新: 探索并證明了利用大模型合成高質(zhì)量、多領(lǐng)域推理訓(xùn)練數(shù)據(jù)的可行性,巧妙地解決了該領(lǐng)域訓(xùn)練數(shù)據(jù)稀缺的核心瓶頸。
  3. 強(qiáng)化學(xué)習(xí)賦能: 成功將強(qiáng)化學(xué)習(xí)應(yīng)用于 Reranker 訓(xùn)練,讓模型在面對(duì)困難樣本時(shí)具備了更強(qiáng)的推理和泛化能力。

相關(guān)模型權(quán)重、訓(xùn)練代碼及訓(xùn)練數(shù)據(jù)即將面向社區(qū)開放,進(jìn)一步推動(dòng)該領(lǐng)域的研究與應(yīng)用發(fā)展。

項(xiàng)目主頁:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_Reasoner

簡(jiǎn)介

推理密集型信息檢索(Reasoning-Intensive IR)是近年來興起的一類新型信息檢索任務(wù)。與傳統(tǒng)檢索不同,它不僅依賴語義匹配,還需要綜合運(yùn)用深層邏輯推理、多步語義鏈以及相關(guān)背景知識(shí),才能在查詢與目標(biāo)文檔之間建立起正確的語義關(guān)聯(lián)。

為推動(dòng)該領(lǐng)域研究,香港大學(xué)、普林斯頓大學(xué)和斯坦福大學(xué)聯(lián)合提出了首個(gè)面向推理密集型檢索的權(quán)威評(píng)測(cè)基準(zhǔn) BRIGHT。該基準(zhǔn)匯集了來自 StackExchange、LeetCode、數(shù)學(xué)競(jìng)賽等領(lǐng)域的真實(shí)查詢,并將其與需要多步推理才能識(shí)別的相關(guān)文檔進(jìn)行配對(duì),用于評(píng)估檢索系統(tǒng)在復(fù)雜推理場(chǎng)景下的能力。

在 BRIGHT 基準(zhǔn)下,傳統(tǒng)依賴關(guān)鍵詞匹配或簡(jiǎn)單語義相似度的方法往往難以定位真正相關(guān)的目標(biāo)文檔,暴露出當(dāng)前檢索系統(tǒng)在復(fù)雜推理場(chǎng)景中的不足。因此,如何在推理密集型檢索中提升系統(tǒng)性能,成為推動(dòng)檢索增強(qiáng)生成(RAG)在復(fù)雜推理任務(wù)中發(fā)展的關(guān)鍵問題。

圖 1. 不同于基于關(guān)鍵詞和直接語義匹配的檢索任務(wù),BRIGHT 評(píng)測(cè)基準(zhǔn)關(guān)注于推理密集型場(chǎng)景下的檢索任務(wù)

在這一背景下,BGE-Reasoner 在推理密集型檢索任務(wù)中展現(xiàn)出卓越性能。在 BRIGHT 榜單中,它超越了此前由螞蟻、百度、字節(jié)跳動(dòng)、人民大學(xué)、滑鐵盧大學(xué)等機(jī)構(gòu)提交的成果,并以領(lǐng)先第二名 3.6 分的優(yōu)勢(shì)刷新紀(jì)錄。與此同時(shí),其內(nèi)置向量模型 BGE-Reasoner-Embed 也大幅超越了 Seed1.5-Embedding、Qwen3-Embedding、GTE 等當(dāng)前最強(qiáng)基線模型,展現(xiàn)了顯著的性能提升。

圖 2. 在 BRIGHT 榜單上,BGE-Reasoner 取得 SOTA 表現(xiàn)于 8 月 21 日榮登第一名,BGE-Reasoner-Embed 使用原生查詢即表現(xiàn)出色,在向量模型中取得 SOTA 結(jié)果,榜單鏈接:https://brightbenchmark.github.io

圖 3. BGE-Reasoner 及 BGE-Reasoner-Embed 與基線模型在 BRIGHT 上的檢索表現(xiàn)對(duì)比圖

技術(shù)分析

BGE-Reasoner 采用信息檢索中的經(jīng)典三模塊體系:

  • 查詢理解 —— BGE-Reasoner-Rewriter:對(duì)初始查詢進(jìn)行理解與改寫,生成更適合檢索的優(yōu)化查詢;
  • 向量模型 —— BGE-Reasoner-Embed:與 BM25 協(xié)同利用改寫后的查詢進(jìn)行檢索,獲取候選文檔集合;
  • 排序模型 —— BGE-Reasoner-Reranker:對(duì)候選文檔進(jìn)行重排序,得到更為準(zhǔn)確的排序結(jié)果。

在實(shí)際工作流程中,用戶的原始查詢首先經(jīng)過 BGE-Reasoner-Rewriter 改寫,然后由 BGE-Reasoner-Embed 與 BM25 并行檢索得到候選文檔,最后交由 BGE-Reasoner-Reranker 進(jìn)行精排。系統(tǒng)通過集成多路結(jié)果,輸出最終排序,完成端到端的推理式檢索流程。完整框架如下圖所示:

圖 4. BGE-Reasoner 的端到端檢索流程示意圖

數(shù)據(jù)合成。不同于傳統(tǒng)的開放式問答場(chǎng)景,推理密集型信息檢索場(chǎng)景下的訓(xùn)練數(shù)據(jù)十分稀缺。為了解決這一問題,智源及合作機(jī)構(gòu)的研究團(tuán)隊(duì)訴諸于基于大語言模型的數(shù)據(jù)合成策略。具體來說,基于現(xiàn)實(shí)場(chǎng)景中存在的知識(shí)密集型語料庫,合成出針對(duì)特定場(chǎng)景的高質(zhì)量推理密集型查詢,然后借助于大語言模型強(qiáng)大的理解能力為每個(gè)查詢構(gòu)造出高質(zhì)量的正例和負(fù)例。最終構(gòu)造出一份覆蓋數(shù)學(xué)、代碼等多個(gè)領(lǐng)域的高質(zhì)量推理密集型檢索訓(xùn)練數(shù)據(jù),為后續(xù)各個(gè)模塊的訓(xùn)練提供支撐。

查詢理解。在查詢理解模塊中,研究人員基于前述合成數(shù)據(jù),借助推理能力較強(qiáng)的教師模型生成多條推理路徑,并通過拒絕采樣策略篩選高質(zhì)量結(jié)果以構(gòu)建訓(xùn)練樣本。隨后,利用這些訓(xùn)練數(shù)據(jù)對(duì) Qwen2.5-7B-Instruct 模型進(jìn)行微調(diào),從而顯著提升其在查詢理解與改寫方面的能力,最終得到 BGE-Reasoner-Rewriter。

向量模型。內(nèi)嵌的向量模型 BGE-Reasoner-Embed 基于 Qwen3-8B 基座模型進(jìn)行微調(diào)。依托高質(zhì)量的合成訓(xùn)練數(shù)據(jù),模型在推理密集型檢索任務(wù)中的能力得到了顯著增強(qiáng)。在 BRIGHT 基準(zhǔn)下,無論是基于原始查詢還是 GPT-4 推理查詢,BGE-Reasoner-Embed 均取得了當(dāng)前向量模型中的最佳檢索表現(xiàn),充分驗(yàn)證了所構(gòu)建合成數(shù)據(jù)的有效性。

排序模型。內(nèi)嵌的排序模型 BGE-Reasoner-Reranker 基于 Qwen3 系列基座模型進(jìn)行微調(diào)。結(jié)合任務(wù)場(chǎng)景下的相關(guān)性定義,模型能夠在查詢與候選文檔之間展開細(xì)粒度推理,識(shí)別關(guān)鍵信息片段并準(zhǔn)確評(píng)估相關(guān)性。在訓(xùn)練過程中,引入強(qiáng)化學(xué)習(xí)以提升模型在困難樣本上的推理能力;在推理階段,模型通過測(cè)試時(shí)擴(kuò)展(test-time augmentation)獲取更加穩(wěn)健的相關(guān)性評(píng)分,從而進(jìn)一步增強(qiáng)排序性能。

圖 5. BGE-Reasoner-Reranker 的推理過程示意圖

總結(jié)

BGE-Reasoner 的卓越表現(xiàn)充分驗(yàn)證了強(qiáng)化學(xué)習(xí)與合成數(shù)據(jù)在推理密集型信息檢索中的重要作用,為未來 Agent Search 的發(fā)展提供了關(guān)鍵支撐。

智源研究院將持續(xù)深耕向量模型與檢索增強(qiáng)技術(shù),不斷提升 BGE 系列模型的能力與通用性。未來期待與更多科研機(jī)構(gòu)及產(chǎn)業(yè)伙伴合作,共同推動(dòng)檢索與人工智能的發(fā)展,歡迎研究者與開發(fā)者關(guān)注并使用 BGE 系列模型,共建開放繁榮的開源生態(tài)。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-08-21 13:49:00

圖像技術(shù)

2021-12-06 09:53:09

自然語言神經(jīng)網(wǎng)絡(luò)人工智能

2019-11-28 14:31:34

量子計(jì)算機(jī)芯片超算

2025-10-29 16:16:49

Auto-RAGRAG大語言模型

2025-10-27 09:15:00

2025-05-26 08:40:00

2022-03-08 09:15:29

人工智能語音識(shí)別模型

2025-03-19 09:30:00

2025-06-10 09:07:00

2025-04-18 09:13:00

2025-10-08 10:44:16

2013-06-19 11:32:32

計(jì)算性能ISCHPC

2024-04-07 09:00:00

數(shù)據(jù)模型

2025-04-01 09:32:00

模型訓(xùn)練AI

2025-09-24 09:10:24

2024-08-12 14:00:00

2024-06-17 07:10:00

2024-12-09 10:15:00

AI技術(shù)

2022-03-28 10:32:28

AI功能手勢(shì)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

色婷婷综合久久久久中文一区二区| 日韩免费在线看| 欧美孕妇孕交| 欧美激情一区二区在线| 精品国产一区二区三区无码| 免费人成网站在线观看欧美高清| 精品一区二区不卡| 99国产精品视频免费观看一公开| 91大片在线观看| 欧美激情第10页| 国产一区二区自拍| 一本色道精品久久一区二区三区| 欧美在线资源| 永久www成人看片| 中老年在线免费视频| 尤物网址在线观看| 日韩成人综合网| 99视频精品| 亚洲专区一二三| 欧美日韩激情一区二区| 日韩一区二区免费在线电影| 在线观看av的网址| 日韩成人动漫| 中文字幕欧美三区| 好男人看片在线观看免费观看国语| 2024国产精品| 五月婷婷视频在线观看| 久久精品99久久久久久久久| 99久久99九九99九九九| 91精品国产欧美一区二区| 深夜福利在线视频| 欧美性xxxx18| 美女网站视频一区| 久久在线视频在线| 日韩欧美精品久久| 婷婷综合久久| http;//www.99re视频| 精品国产1区2区| 免费观看一级欧美片| 欧美日韩一区视频| 国产日韩在线| 国产亚洲欧美日韩日本| 久久天天躁狠狠躁夜夜av| 川上优的av在线一区二区| 欧美日韩激情小视频| 毛片一级免费一级| 亚洲国产成人精品视频| 成色在线视频| 亚洲视频小说| 日本不卡在线视频| 国产精品系列在线观看| 欧美在线播放一区| 久久青草久久| 亚洲一区在线直播| 成人国产精品视频| 中文字幕天天干| 亚洲一区二区黄色| 日本中文字幕一区二区有码在线| 一本久久精品一区二区| 拍真实国产伦偷精品| 亚洲激情电影中文字幕| 电影一区二区| 91av在线免费观看视频| 日韩理论电影院| 精品综合在线| 日本成人在线免费视频| 日本а中文在线天堂| 亚洲区免费影片| 欧美午夜在线播放| 国产z一区二区三区| 欧美jjzz| 一区二区精品国产| 国产偷国产偷精品高清尤物| 免费男女羞羞的视频网站主页在线观看 | 欧美日韩视频一区二区三区| 精品无码久久久久国产| 日本中文字幕一区二区有限公司| 免费视频爱爱太爽了| 中文字幕视频一区二区三区久| 亚洲美女欧洲| 亚洲免费精彩视频| 日韩福利视频一区| 欧美日韩喷水| 日本一区二区视频在线| 嫩草精品影院| 丝袜美腿精品国产二区| 午夜精品一区二区三区国产| 日日噜噜噜夜夜爽爽| 成人aaaa免费全部观看| 日本加勒比高清在线| 91精品婷婷国产综合久久竹菊| 久久精品资源| 999国内精品视频在线| 盗摄精品av一区二区三区| 香蕉视频色版| 日韩精品视频免费在线观看| 国产一区二区三区四区大秀| 色吧亚洲视频| 亚洲一区二区三区小说| 中文在线最新版地址| 91视频免费网站| 91在线porny国产在线看| 91大神xh98hx在线播放| 久久99热这里只有精品国产| 日韩视频在线一区二区三区 | 日韩欧美在线播放| 久久91导航| 成人av男人的天堂| 中文文精品字幕一区二区| 免费污视频在线| 国产精品三级美女白浆呻吟| 丁香六月综合激情| 快射av在线播放一区| 日本成人免费在线| 成人免费高清在线| 主播国产精品| 国产在线视频一区| 久久久综合九色合综国产精品| 亚洲精品一线| 91精品综合久久久久久五月天| 国产亚洲欧美一级| 天天综合网站| 日韩福利影院| 日本久久一区二区三区| 久久婷婷国产| 国产日产欧美视频| 亚洲精品永久免费精品| 在线亚洲自拍| 青青草视频在线免费观看| 久久人人爽人人| 国产成人一区在线| h片在线观看下载| 欧美日韩在线观看一区二区三区| 亚洲成人手机在线| 国产精品一国产精品| 中文字幕天天干| 欧美黑人xxx| www.日本不卡| 亚洲播播91| 日本福利视频网站| 亚洲乱码一区av黑人高潮| 丝袜美腿成人在线| 成年人黄视频在线观看| 国产一区二区久久久| 精品福利在线观看| 欧美fxxxxxx另类| 成年午夜在线| 久久免费视频1| 日韩一卡二卡三卡国产欧美| 香蕉精品999视频一区二区| 麻豆电影在线播放| 日韩av电影免费在线观看| 91精品国产入口| 玖玖精品视频| 爱福利在线视频| 天天成人综合网| 亚洲视频日韩精品| 福利一区二区在线观看| 蜜桃精品在线| av观看免费在线| 久久久久久国产| 亚洲色图一区二区三区| 欧美午夜精彩| 国产毛片av在线| 欧美一区二区三区四区五区六区| 日韩三级视频中文字幕| 日本aⅴ亚洲精品中文乱码| 麻豆mv在线看| 成人免费视频91| 九九视频直播综合网| 国产精品毛片无遮挡高清| 亚洲影院天堂中文av色| 亚洲最新合集| 精品一区国产| 亚洲成人黄色在线| 成人18视频日本| 免费不卡中文字幕在线| 久久精品蜜桃| 欧美裸体网站| 最近2019中文字幕一页二页| 国产精品国产成人国产三级| 97精品视频在线看| 国产不卡在线| 久久久999视频| 国产日韩欧美在线播放| 3d动漫精品啪啪1区2区免费 | 成人福利在线视频| 欧美久久久久免费| 精品一区精品二区高清| 国产精品久久免费视频 | 国产精品一区在线| 国产成人在线中文字幕| 在线视频尤物| 欧美午夜精品理论片a级大开眼界| 日韩黄色av网站| 国产精品美女久久久久久| 最新精品国产| 欧美影院在线播放| 成人有码视频在线播放| 成人a免费视频|