国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

從第一性原理出發的RAG推理新范式來了,螞蟻DIVER登頂權威基準

人工智能 新聞
螞蟻集團 AQ-MedAI 團隊提出了 DIVER(Deep reasonIng retrieVal and rERanking) 框架,旨在解決「推理密集型」(Reasoning-Intensive)場景下的信息檢索難題。

在當前由大語言模型(LLM)驅動的技術范式中,檢索增強生成(RAG)已成為提升模型知識能力與緩解「幻覺」的核心技術。然而,現有 RAG 系統在面對需多步邏輯推理任務時仍存在顯著局限,具體挑戰如下:

  • 表面相關性 (Surface Relevance):基于 TF-IDF/BM25 等傳統方法過度依賴詞匯重疊度,傾向于召回與查詢共享關鍵詞的文檔,導致檢索結果停留于淺層文本匹配。
  • 深度相關性 (Deep Relevance):真實場景中的復雜查詢(如醫學診斷推導、數學定理證明)其相關性往往是隱性的,隱藏在概念類比、邏輯推演或因果鏈條之中,需要模型具備超越字面含義的理解能力。

為建立嚴格的評估體系,學術界提出了 BRIGHT—— 首個面向推理密集型檢索的權威測試集。該基準涵蓋了源自經濟學、心理學、數學及編程等多個知識密集型領域的真實查詢。這些查詢的共性在于其答案無法通過傳統的直接檢索顯式獲得,使得很多 RAG 系統失效。而 BRIGHT 必須通過多步推理構建證據鏈,也就是所謂的「第一性原理」, 從 「根源」 推導,而非 「類比」來解決問題。

針對這一技術挑戰,螞蟻集團 AQ-MedAI 團隊提出了 DIVER(Deep reasonIng retrieVal and rERanking) 框架,旨在解決「推理密集型」(Reasoning-Intensive)場景下的信息檢索難題。

  • 論文標題:DIVER: A Multi-Stage Approach for Reasoning-intensive Information Retrieval
  • arXiv 地址:https://arxiv.org/pdf/2508.07995
  • 代碼與模型開源地址:
  • https://github.com/AQ-MedAI/DIVER
  • https://huggingface.co/AQ-MedAI/DIVER-Retriever-4B
  • https://huggingface.co/AQ-MedAI/Diver-Retriever-0.6B

目前,DIVER 框架在 BRIGHT 公開排行榜上測評得分 45.8,排名第一,充分驗證了其技術的領先性。

DIVER:推理驅動式檢索系統

DIVER 是一套推理驅動式的檢索框架,其將復雜的檢索任務分解為四個階段,主要為 DIVER-DChunk、DIVER-QExpand、DIVER-Retriever 和 DIVER-RERANK。

DIVER:技術架構深度拆解

第一階段:文檔預處理(DIVER-DChunk)—— 奠定堅實基礎

高質量的知識庫是有效檢索的前提。DIVER 首先對原始文檔進行「凈化」和「重組」。它會自動清除文本中的噪聲(如無關的 HTML 標簽、格式錯誤),并利用語義理解技術將過長的文檔智能切分為邏輯連貫、大小適中的「知識塊」。

這一步確保了后續模型讀取的是清晰、有序、高質量的信息,為后續的推理環節打下了堅實的基礎。

第二階段:查詢擴展(DIVER-QExpand)—— 讓模型學會「追問」和「聯想」

用戶的原始問題可能不夠精確,DIVER 采用了一種與文檔「互動」的迭代式查詢擴展策略。當接收到用戶的初始查詢后,系統并非立即進行檢索,而是利用一個強大的語言模型對查詢進行迭代式的「精煉」和「擴展」。模型會分析初始查詢,并結合初步檢索到的少量文檔,生成更明確的推理路徑和所需證據的描述,然后將這些信息補充回原始查詢中。

這個過程會重復進行,形成一個反饋循環,使查詢的意圖越來越清晰、精準,引導系統走向正確的答案方向。

第三階段:專為推理定制的檢索(DIVER-Retriever)—— 從第一性出發,訓練一位「偵探」,而非「圖書管理員」

有了經過「思考」的查詢,DIVER 會啟用一個經過特殊訓練的檢索模型。這個模型的獨特之處在于其訓練數據:

1. 合成的推理數據:在醫療診斷推導和數學定理證明等復雜推理領域,該技術團隊構建了帶有邏輯鏈標注的合成數據集。這些數據要求模型不僅要匹配關鍵詞,更要學習隱含的邏輯關聯性,如癥狀 - 病理的因果推斷或數學命題的蘊涵關系。

2.「困難負樣本」(Hard Negatives):訓練中包含了大量與正確答案表面相似但實際錯誤的「陷阱」樣本。這迫使模型不僅要看「像不像」,更要理解「是不是」,從而具備了極強的辨別能力。該技術團隊設計了三級負樣本篩選策略:

  • 表層相似:保持詞項重疊但邏輯矛盾的樣本(如「糖尿病胰島素抵抗」vs「糖尿病胰島素分泌過剩」)
  • 結構仿造:模仿正確推理路徑但包含隱性謬誤的樣本
  • 語義對抗:通過語言模型生成的強干擾項

3. 基于難負樣本采樣的對比學習:通過引入對比學習框架,模型將正確答案與這些高難負樣本同時進行對比訓練。模型被迫聚焦于兩者間微妙差異,從而提升了對復雜推理過程中的關鍵信息識別能力和魯棒性。

通過這種方式訓練出的檢索器,能夠精準地從海量信息中捕獲到那些真正支撐推理鏈條的關鍵證據。

第四階段:混合式重排序(Reranking)—— 確保最終答案的質量與連貫性

最后,初步檢索出的文檔列表會進入重排序階段。DIVER 巧妙地結合了兩種策略:逐點排序(Pointwise)策略和列表排序(Listwise)策略。這種「局部精調」與「全局統籌」相結合的混合模式,確保了呈現給用戶的文檔列表既有高質量的個體,又有最優的整體順序。

技術突破驗證

基準測評、行業對比、產業落地全面領先

BRIGHT 榜單達到 SOTA

DIVER 在權威的推理密集型檢索基準 BRIGHT 上,其整體 nDCG@10(衡量前 10 個結果排序質量的指標)達到了 45.8,全面超越了現有的其他具備推理能力的模型,達到了業界頂尖(SOTA)水平。

行業模型對比

在跨領域任務及不同查詢難度的評測中,DIVER-Retriever 展現了顯著的性能優勢與強勁的泛化能力:在數學推理、通用科學和代碼檢索三大場景下,其 nDCG@10 與閉源模型 Seed1.5 Embedding 相比,平均提升 2 個百分點;相較于參數規模為其兩倍的開源模型 ReasonIR-8B,平均提升了 4 個百分點,充分驗證了 DIVER-Retriever 在不同領域與難度條件下均能保持穩健而有效的檢索性能。

AQ 落地應用

醫療領域對知識的準確性和推理的嚴謹性有著極高的要求,尤其是在精準醫療的發展趨勢下,必須根據患者的具體情況和醫學原理制定治療方案,而不能簡單地照搬經驗。

自 6 月在 AQ 醫療應用上線以來,DIVER 驅動的檢索增強系統實現了臨床級檢索和循證精準突破:在診療證據召回場景中,相比 BGE-M3 模型,英文文獻召回的 Hit@1 提升 11 個百分點;中文召回的 Hit@1 從 0.824 提升至 0.922,提升 9.8 個百分點;混合檢索(中文召回英文)的 Hit@1 提升 8.6 個百分點。

同時 DIVER-Dchunk 應用在離線指南與論文的 chunking 環節,大幅提升了指南與論文檢索信息的有效性。

展望

螞蟻 MedAI 將持續深耕復雜推理型的檢索技術以及重排序技術,持續提升在醫療復雜推理、泛健康場景的檢索循證能力。該技術團隊將持續優化 DIVER 框架,為臨床決策提供了可驗證、可追溯、可更新的知識基礎設施,重新定義醫療級 RAG 的技術標準。

接下來,該技術團隊會陸續開源其他 size 的檢索模型以及重排序模型,歡迎研究者與開發者關注并使用他們的模型,期待與更多科研機構及產業伙伴合作,共建開放繁榮的開源生態,共同推動人工智能與醫療 AI 的發展。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-05 15:00:00

模型訓練

2010-06-10 15:30:54

路由協議

2018-02-07 10:56:53

HR

2022-03-24 14:51:33

深度學習AI研究

2025-11-28 03:55:00

2011-04-28 16:36:17

投影機

2025-02-19 14:00:00

模型AI訓練

2025-07-15 09:27:29

2025-03-24 09:30:00

2023-10-11 13:09:09

OpenAI模型GPT-4

2022-05-17 11:16:33

軟件開發優化

2025-03-03 11:41:11

2024-05-21 09:46:35

視覺自動駕駛

2021-08-05 09:46:11

人工智能機器學習技術

2025-12-15 08:03:00

AI模型數據

2022-03-22 14:15:57

計算模型訓練

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-06-30 04:15:00

2025-11-19 11:20:20

AI視覺模型
點贊
收藏

51CTO技術棧公眾號

亚洲人metart人体| 久久久久久久久久久久久久久久久久av| 国产熟女高潮视频| 不卡一本毛片| 欧美经典一区二区三区| 欧美专区国产专区| 国产精品视频一区二区高潮| 欧洲在线/亚洲| 久久本道综合色狠狠五月| 国产精品99一区二区三区| 91精品国产91久久久久久久久 | 亚洲一卡二卡区| 免费中文字幕日韩欧美| 国产精品亚洲片夜色在线| 欧美日本久久| 欧美一区二区播放| 国产资源在线观看| 欧美性色xo影院| 成人免费视频| 91精品国产一区二区三区蜜臀| 免费在线视频欧美| 91麻豆精品91久久久久同性| a在线免费观看| 欧美videos中文字幕| 黄视频在线观看网站| 五月天激情小说综合| 天天色综合4| 蜜桃av一区二区在线观看| 亚洲欧洲精品一区| 91丝袜美腿高跟国产极品老师| 美女激情网站| 欧美不卡视频一区| 欧美一区二粉嫩精品国产一线天| 国产精品不卡| 蜜臀av色欲a片无码精品一区 | 手机在线电影一区| 成人免费黄色网| 午夜电影亚洲| 日韩欧美一区二区三区四区五区| 国内精品国产成人| 能在线观看的av网站| 夜夜嗨av一区二区三区网页| 黄网在线观看| 亚洲精品美女久久| 国产人与zoxxxx另类91| 日本精品va在线观看| 亚洲无毛电影| 草b视频在线观看| 亚洲综合在线第一页| 高潮毛片在线观看| 久久精品99久久久香蕉| 成人网18免费网站| 欧美在线一区二区三区四区| 成人三级伦理片| 天天色综合天天色| 欧美日韩一区高清| 久久久加勒比| 亚洲一区中文字幕| 成人久久18免费网站麻豆| 国产99在线|中文| 99精品国产高清在线观看| 国产美女av一区二区三区| 成人免费xx| 欧美日韩在线视频观看| 韩国中文字幕在线| 久久久久久久999| 久久一综合视频| 91精品国产入口在线| 日产精品一区二区| 午夜精品久久久久久久白皮肤 | 黄色小说在线播放| 精品999视频| 午夜伦理一区二区| 在线观看黄色| 中文字幕精品一区二区精品| 婷婷综合六月| 国模视频一区二区| 9l视频自拍蝌蚪9l视频成人| 亚洲永久免费观看| 国产精品性做久久久久久| 国产精品久久中文字幕| 国产精品久久久久影院亚瑟| 欧美18hd| 免费成人av网站| 亚洲午夜日本在线观看| 国产伦理精品| 国严精品久久久久久亚洲影视| 欧美在线国产| av二区在线| 日韩在线观看视频免费| 日本一区福利在线| 国产精品视频网站| 国产**成人网毛片九色| 触手亚洲一区二区三区| 欧美日韩高清一区| 久久午夜影院| 婷婷久久青草热一区二区| 91麻豆福利精品推荐| www日韩在线观看| 欧美夫妻性生活| 精品国产一区二区三区噜噜噜| 国产欧美综合一区| 成人av网址在线| 欧美女子与性| 日韩视频在线免费| 亚洲欧洲中文字幕| 亚洲AV无码成人精品一区| 男人添女荫道口图片| 性欧美video另类hd尤物| 美日韩丰满少妇在线观看| 日韩在线欧美| 国产精品久久久久久久久久久久午夜片| 国产91成人video| 欧美日韩一区在线视频| 久久久久久久久久久免费精品| 久久久国产欧美| 欧美日韩中文字幕日韩欧美| 国产传媒av在线| 欧美亚洲国产另类| 日韩一区三区| 四虎永久免费网站| 五月激情综合婷婷| 色在线中文字幕| 成人欧美一区二区三区视频xxx | 欧美gv在线观看| 97视频在线观看播放| 性欧美ⅴideo另类hd| 成人黄色生活片| 国产欧美精品一区二区色综合朱莉| 久草在线网址| 亚洲在线免费看| 樱桃视频在线观看一区| 日本免费一区二区三区等视频| 日韩久久在线| 精品在线观看国产| 日韩高清一级片| av在线不卡电影| 婷婷丁香久久| 久久久久久爱| 激情欧美日韩一区| 亚洲2区在线| 青青草成人免费在线视频| 欧美成人免费网站| 欧美ab在线视频| 大片免费播放在线视频| 97色在线观看| 国产精品色哟哟| 亚洲一区二区三区中文字幕在线观看| 免费在线黄网站| 日韩精品免费综合视频在线播放 | 欧美二级三级| 欧美精品久久99久久在免费线 | 亚洲欧美偷拍自拍| 国产福利图片| 日韩精品福利片午夜免费观看| 正在播放欧美一区| 欧美日韩中文字幕精品| 精品少妇一区二区三区| 亚洲精品一级二级三级| 伊人久久五月天| 天天色天天操综合| 国产成人久久精品77777最新版本| 天海翼精品一区二区三区| 91在线中文| 你懂的在线播放| 任你操这里只有精品| 日本视频精品一区| 一区二区三区我不卡| 国产在线精品91| 日本一区二区三区视频在线播放 | 亚洲最新av网址| 337p亚洲精品色噜噜噜| 欧美aaaxxxx做受视频| 亚洲性日韩精品一区二区| 欧美极品少妇全裸体| 久久午夜免费电影| 国产在线日韩精品| 欧美激情视频在线播放| 亚洲第一综合网站| 26uuu日韩精品一区二区| 欧美群妇大交群中文字幕| 成人av在线一区二区三区| 成人情趣视频| 伊人久久视频| a视频在线看| 欧美h视频在线观看| 国产成人鲁鲁免费视频a| 精品国免费一区二区三区| 国产精品久久免费看| 一区二区三区成人精品| 永久免费精品视频| 97影院秋霞午夜在线观看| 色综合色综合色综合色综合| 久久99精品久久久久子伦| 欧美激情a在线| 欧美一区二区三区免费视频| 日韩一区日韩二区| 国产99精品在线观看| 一本一本久久| 欧美日韩黑人|