国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

經驗記憶黑科技:LightSearcher讓AI工具調用減39.6%、推理快48.6%

人工智能 新聞
北郵百家 AI 團隊提出 LightSearcher 框架,首創基于經驗記憶的高效 RL 優化技術,通過引入文本化經驗記憶和自適應獎勵塑造機制,巧妙解決了這一痛點。

如今,以 DeepSeek-R1 為代表的深度思考大模型能夠處理復雜的推理任務,而DeepSearch 作為深度思考大模型的核心搜索器,在推理過程中通過迭代調用外部搜索工具,訪問參數邊界之外的最新、領域特定知識,從而提升推理的深度和事實可靠性。

然而,現有的 RL 驅動的深度思考大模型系統常常面臨準確率與效率的「蹺蹺板」困境:頻繁調用搜索工具提升準確性,卻帶來計算開銷和效率低下。具體而言,高頻調用外部搜索工具雖能補充實時信息、提升推理準確率,但使得推理延遲大幅升高,等待時間可達幾十秒至幾分鐘。從用戶體驗角度來看,若信息加載時間超過 10 秒,50% 的移動用戶會放棄訪問。

北郵百家 AI 團隊提出 LightSearcher 框架,首創基于經驗記憶的高效 RL 優化技術,通過引入文本化經驗記憶和自適應獎勵塑造機制,巧妙解決了這一痛點。

在保持與 SOTA 基線 ReSearch 相當準確率的同時,搜索工具調用和模型回復時間顯著縮短,搜索工具調用次數減少 39.6%,推理時間縮短 48.6%,Token 消耗降低 21.2%,在保持模型效果的同時顯著提升了工具調用效率。

  • 論文標題:LightSearcher: Efficient DeepSearch via Experiential Memory
  • 論文鏈接:https://arxiv.org/abs/2512.06653
  • 百家 AI 主頁:https://baijia.online/homepage/index

引言

如何教會深度思考大模型策略性地控制搜索工具的使用,優化何時以及如何查詢外部知識源,是深度思考大模型亟待解決的問題。現有方法存在以下顯著缺陷:

  1. 提示工程或監督學習方法依賴人工標注,成本高且泛化差;RL 驅動方法雖能自主優化,但獎勵偏重準確性,導致模型為確保正確而頻繁調用工具,造成冗余開銷;
  2. 工具調用「過度依賴」,現有模型往往不分難易,對簡單查詢也反復檢索,導致推理時間延長、token 消耗激增;
  3. 準確性與效率失衡,部分方法雖提升準確率,但犧牲效率;另一些雖減少調用,卻降低答案質量,無法兼顧雙重目標。

這些問題導致現有模型要么答案不準、可靠性差,要么工具調用過多、效率低下,難以同時滿足推理準確和高效執行的核心需求。

LightSearcher 框架

為解決上述缺陷,北郵百家 AI 團隊提出基于經驗記憶的高效 DeepSearch 框架(LightSearcher),核心思路是在大模型強化推理過程中,通過「對比經驗學習」將隱性推理軌跡轉化為顯性指導經驗,并結合自適應獎勵優化工具調用,具體包含三大關鍵組件:

  1. 對比經驗推理機制(Contrastive Experiential Reasoning):收集高低質量推理軌跡,通過 LLM 生成成功模式的自然語言總結(如「簡單查詢優先用內部知識」),構建動態經驗記憶庫;
  2. 自適應獎勵塑造機制(Adaptive Reward Shaping):引入最小工具調用基準,僅在答案正確時懲罰冗余調用,使用指數衰減函數動態平衡準確性和效率,避免盲目優化; 
  3. 基于經驗的 RL 訓練機制:采用 GRPO 算法,將積累經驗和少樣本示例融入提示模板,指導模型生成高效軌跡,確保探索與利用的均衡。 

模型最終優化目標為多目標獎勵函數的加權和,確保工具調用精簡與答案質量的協同提升。

實驗

研究團隊在四個多跳 QA 基準數據集(NQ、HotpotQA、Musique、2WikiMultihopQA)上進行了全面評估,對比了多種主流 DeepSearch 方法。

3.1 主實驗結果

實驗結果顯示:

  • 模型準確性保持頂尖:LightSearcher 在 F1 分數和 LLM 評判上與 SOTA 基線 ReSearch 相當,甚至在部分數據集上優于 ReSearch;
  • 效率顯著提升:工具調用減少 39.6%,推理時間縮短 48.6%,token 消耗降低 21.2%;
  • 泛化能力強:在不同難度的查詢(易 / 難)上均表現穩定,即使在域外測試集也能超越依賴固定檢索的迭代方法。

3.2 消融實驗

移除經驗導致 F1 下降 7.2%,證明其核心作用。

LightSearcher 框架通過「經驗記憶」這一核心理念,為構建高效、可靠的深度推理系統提供了新路徑。盡管目前限于多跳 QA,未來可擴展到代碼合成、策略規劃等領域。論文成功解決了現有 DeepSearch 的關鍵痛點:

  • 從隱性到顯性:將對比軌跡轉化為可解釋的推理指導
  • 精準平衡:通過自適應獎勵確保工具調用最小化
  • 效率優先:利用 RL 訓練維持準確與開銷的連貫性
  • 雙重優化:同時提升推理質量和執行效率,而非顧此失彼  

最后,大模型的 DeepSearch 能力需設計有效的經驗機制。相比于復雜的手動標注,LightSearcher 通過其「對比經驗」的設計思想,在推理過程依賴可靠的外部知識調用,為構建更加高效、可靠的 AI 深度思考系統提供了重要的技術路徑。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-07-23 06:38:40

AI芯片數據中心

2019-08-16 09:07:47

RedisNoSQL數據庫

2020-07-10 10:34:22

人工智能無人機物聯網

2025-03-26 06:48:46

2020-07-07 11:10:51

曙光

2017-01-06 13:45:45

智能 運動

2024-07-18 07:07:07

2021-05-12 09:00:00

AI 數據人工智能

2025-07-07 13:42:57

大模型AI開源

2025-02-24 08:10:00

C#代碼開發

2021-05-21 09:49:56

數字化

2020-08-17 09:15:09

AI 數據人工智能

2023-08-09 12:21:58

軟件工具AI

2025-02-14 09:30:00

2021-03-01 18:52:39

工具在線瀏覽器

2019-01-03 19:56:26

探境

2020-05-28 14:11:41

AI 黑科技人工智能

2024-07-12 14:07:04

2017-08-17 10:43:27

AMD架構AI GPU
點贊
收藏

51CTO技術棧公眾號

国产在线拍揄自揄视频不卡99| 亚洲一二区在线| 欧美暴力调教| 色哟哟国产精品| 成人免费乱码大片a毛片软件| 国产99精品在线观看| 国产91免费视频| 久久资源中文字幕| 日韩美女毛茸茸| 国产亚洲久久| www日韩欧美| 日本一区免费网站| 亚洲男人的天堂网站| 免费a级人成a大片在线观看| 福利视频导航一区| 在线香蕉视频| 欧美性xxxx18| 黄色av网站在线看| 午夜久久久久久久久久一区二区| 亚洲一区二区三区四区五区xx| av成人动漫在线观看| 亚洲 国产 欧美一区| 91一区一区三区| 国产综合 伊人色| 男女性色大片免费观看一区二区| 成人激情免费在线| 久久视频国产| 邪恶网站在线观看| 91免费观看在线| 精品夜色国产国偷在线| 日韩aaa久久蜜桃av| 亚洲欧美激情精品一区二区| 国产网站在线| 中文字幕亚洲欧美日韩在线不卡| 精品免费av一区二区三区 | 五月天综合网| 毛片不卡一区二区| 免费cad大片在线观看| 成年网站免费| 欧美网站在线观看| а√天堂在线官网| 亚洲人成电影网站色www| 四虎国产精品免费久久5151| 久久久噜噜噜久久中文字免| 日本午夜一区| 日韩欧美亚洲v片| 成人激情免费网站| 日韩精彩视频在线观看| 免费久久久一本精品久久区| 青青精品视频播放| 欧美色爱综合网| 免费在线国产| 中文字幕欧美日韩一区| 久久综合九色综合88i| 91免费观看国产| 日日躁夜夜躁aaaabbbb| 天堂在线一区二区| 国产综合久久久久久鬼色| 300部国产真实乱| 午夜午夜精品一区二区三区文| 久久99精品国产.久久久久久| 精品久久久久av| 日本高清不卡在线观看| 久久99亚洲网美利坚合众国| 这里只有精品视频| 精品少妇av| 一区二区三区三区在线| 亚洲欧美区自拍先锋| 污片在线免费观看| 26uuu亚洲国产精品| 噜噜噜在线观看免费视频日韩 | 日韩成人午夜| 日本一区二区三区www| 久久精品亚洲乱码伦伦中文 | 自拍偷拍欧美日韩| 亚洲一区二区三区视频| av中文字幕在线不卡| 国产最新视频在线| 欧美大荫蒂xxx| 久久婷婷麻豆| 中文字幕在线永久在线视频| 国产亚洲精品久久久久久牛牛| 精品久久一二三| 日韩免费av一区二区| 韩国午夜理伦三级不卡影院| 日韩精品久久一区二区| 国产经典自拍视频在线观看| 亚洲人成免费电影| 欧美成人黑人| 欧美激情成人动漫| 日韩极品精品视频免费观看| 国产99久久久国产精品| 免费人成在线观看网站| 亚洲3p在线观看| 国产福利小视频在线| 欧美 日韩 国产精品| 日韩视频亚洲视频| 亚洲影视在线| a视频免费看| www.久久久久| 久久精品一区二区三区中文字幕 | 久久精品日产第一区二区三区乱码| 久久综合九色综合97婷婷| 狠狠狠色丁香婷婷综合久久五月| 国产区视频在线播放| 福利视频网站| 日韩成人av一区| 欧美影院一区| 91破解版在线看| 97精品国产91久久久久久| 国产馆精品极品| 91福利区在线观看| 久久国产精品 国产精品| 精品福利视频导航| 久久不见久久见中文字幕免费 | 777.av| 翔田千里亚洲一二三区| 欧美日韩精品高清| 亚洲精品一二三区区别| 日韩一二三四| 99re国产| 在线看不卡av| 久久精品一区| 伊人久久大香线蕉综合影院首页| 日韩精品一区二区三区四区| 欧美精品网站| 国产在线国偷精品产拍免费yy | 欧美美女搞黄| 亚洲线精品一区二区三区八戒| 国产原创一区二区| 亚洲高清影视| 久久99久久99精品免观看软件| 青青草在线播放| 白白色 亚洲乱淫| 欧美国产日韩在线播放| 国产精品456露脸| 1769免费视频在线观看| 久久天天狠狠| 欧美一级日韩免费不卡| 国产成人精品日本亚洲专区61| 日韩欧美在线网站| 国产日韩欧美综合一区| 888久久久| 国产精品日韩精品在线播放| 精精国产xxxx视频在线| 9色porny| 久久久久久免费看| eeuss一区二区三区| 91精品国产精品| 26uuu亚洲| 美女网站久久| 极品美女一区二区三区| 都市激情国产精品| 欧美洲成人男女午夜视频| 亚洲一区av| 福利在线一区二区三区| 97视频免费在线看| 懂色av影视一区二区三区| 四季av一区二区凹凸精品| 凹凸av导航大全精品| 麻豆精品国产| 成人看片网页| 免费在线午夜视频| 99reav2| 无码人妻aⅴ一区二区三区日本| 国产丝袜视频一区| 日韩欧美aⅴ综合网站发布| 国产精品久久精品日日| 久久免费视频一区| 国产精品一区在线观看你懂的| 91精品国产麻豆国产在线观看 | 国产精品美女久久久久人| 二区在线播放| 国产精品一区二区三区精品| 亚洲成人黄色在线观看| 国产传媒一区在线| 国产一区一区| 啦啦啦中文高清在线视频| 69174成人网| 日韩亚洲欧美中文在线| 日本一区免费视频| 国产日本精品| 日韩中文字幕亚洲一区二区va在线| 97视频热人人精品免费| 色喇叭免费久久综合网| 色777狠狠狠综合伊人| 亚洲在线电影| 中国女人久久久| 日韩电影在线观看网站| 日韩av网站大全| 国产欧美日韩综合精品一区二区| 97精品国产福利一区二区三区| 久久99亚洲网美利坚合众国| 成人狠狠色综合| 日本不卡在线观看| 91地址最新发布| 亚洲精品97久久| 一本到三区不卡视频| 国产亚洲一区二区三区四区| 奇米888四色在线精品|