国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

<tfoot id="wvlnb"></tfoot>

<samp id="wvlnb"><strong id="wvlnb"></strong></samp>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

AI智能體的“死穴”，終于找到破解方式？原創(chuàng) 精華

發(fā)布于 2025-10-11 06:51

瀏覽

0收藏

設(shè)想這樣一個場景：你有一個AI助手，它第一次執(zhí)行任務(wù)時失敗了，但從那一刻開始，它就“記住了教訓”，并且永遠不會再犯同樣的錯誤。這意味著，它不僅能回答你的問題，還能像人一樣，越用越聰明。

這聽起來像是科幻片里的橋段吧？但在人工智能研究領(lǐng)域，這其實一直是一個未解的核心難題。我們構(gòu)建了強大的LLM Agent，它們可以自主調(diào)用工具、規(guī)劃任務(wù)、推理求解，但要么過于僵化，不能學習新經(jīng)驗；要么依賴昂貴的模型微調(diào)（Fine-tuning），既慢又費錢，還無法實時適應(yīng)環(huán)境變化。

最近，一項名為 Memento 的新研究給出了第三種答案： ?? 不需要微調(diào)LLM，只需給它裝上一個“類人記憶系統(tǒng)”，就能實現(xiàn)持續(xù)學習。

這意味著，未來的AI智能體不再是“一次性編程的工具”，而會成為真正意義上能成長、能進化的伙伴。

Github地址：https://github.com/Agent-on-the-Fly/Memento

為什么今天的LLM Agent“不夠聰明”？

AI智能體的“死穴”，終于找到破解方式？-AI.x社區(qū)

要理解Memento的突破，先要看清現(xiàn)狀。目前的LLM Agent，大致可以分成兩種典型模式：

① 剛性Agent（Rigid Agent）

特點：固定流程，任務(wù)導(dǎo)向明確，執(zhí)行穩(wěn)定。
缺陷：完全不會自我修正。
舉例：某些自動化腳本型智能體，能完成網(wǎng)頁信息抓取，但一旦網(wǎng)站改版，它就徹底癱瘓。

② 微調(diào)Agent（Fine-Tuning Agent）

特點：通過不斷微調(diào)參數(shù)來“學習”新任務(wù)。
缺陷：成本極高，訓練流程復(fù)雜，不可能做到“隨學隨用”。
舉例：基于RLHF（人類反饋強化學習）微調(diào)的Agent，理論上能更智能，但訓練一次要花費大量GPU算力。

所以問題來了：有沒有一種方式，讓Agent能像人一樣，通過“記憶”積累經(jīng)驗，而不是每次都大動干戈去微調(diào)模型？

這正是Memento要解決的核心痛點。

AI智能體的“死穴”，終于找到破解方式？-AI.x社區(qū)

什么是Memento？

一句話總結(jié)： ?? Memento = 給LLM Agent加上一個外部記憶系統(tǒng)（Case Bank），讓它像人一樣用“過去經(jīng)驗”指導(dǎo)“未來決策”。

研究團隊受到心理學中的 案例推理（Case-Based Reasoning, CBR） 啟發(fā)：

人類解決新問題時，常常會回憶類似的舊問題；
過去的成功經(jīng)驗、失敗教訓，都會成為決策依據(jù)；
我們并不是“微調(diào)大腦”，而是依賴記憶來進化。

Memento的機制與此如出一轍：

Case Bank：存儲智能體的所有交互軌跡，包括步驟、結(jié)果、成功/失敗標簽；
檢索機制：新任務(wù)來臨時，Agent先去Case Bank找相似案例；
動態(tài)學習：無需修改LLM參數(shù)，而是通過“讀寫記憶”來獲得新的策略。

這就像給AI裝了一個“外置硬盤”，專門用于積累經(jīng)驗。

Memento的架構(gòu)：兩步走，簡單卻強大

Memento的設(shè)計可以分為兩個階段：

?? 階段一：案例驅(qū)動規(guī)劃（Case-Based Planning）

Planner（規(guī)劃器）：由LLM驅(qū)動，接收用戶任務(wù)，拆解為子任務(wù)；
關(guān)鍵點：在制定計劃之前，Planner會去Case Bank檢索歷史案例；
好處：避免重蹈覆轍，同時借鑒過往成功策略。

舉個例子：假設(shè)Agent要完成“爬取論文數(shù)據(jù)并生成總結(jié)”，它會去回顧之前在“信息檢索+摘要”任務(wù)中的經(jīng)驗，尤其是曾經(jīng)失敗的路徑，確保這次不再掉坑。

?? 階段二：工具驅(qū)動執(zhí)行（Tool-Based Execution）

Executor（執(zhí)行器）：另一個LLM，負責調(diào)用外部工具完成子任務(wù)；
工具庫：包含網(wǎng)頁爬蟲、代碼執(zhí)行器、文件解析器等；
持續(xù)記錄：每一步執(zhí)行的結(jié)果都會寫回Case Bank，形成新的經(jīng)驗。

更重要的是，Memento引入了**軟Q學習（Soft Q-learning）**機制，讓Agent能動態(tài)評估：哪些案例最有價值，哪些需要弱化，從而提升檢索質(zhì)量。

實驗表現(xiàn)：不是概念，而是真正跑出來了

Memento并非停留在理論層面，而是在多個權(quán)威測試集上展現(xiàn)了強勁實力：

GAIA基準測試

a.任務(wù)：考察智能體在復(fù)雜長任務(wù)（需多步推理+工具調(diào)用）上的能力；

b.成績：Memento以 79.40% 的準確率拿下Top-1，成為開源Agent框架新標桿。

DeepResearcher數(shù)據(jù)集

a.任務(wù)：實時Web研究，考察Agent在開放環(huán)境下的信息檢索與分析能力；

b.成績：Memento取得 66.6% F1分數(shù)，超越依賴大規(guī)模微調(diào)的對手。

消融實驗（Ablation Study）

a.加入Case Bank后，任務(wù)準確率平均提升 **9.6%**；

b.證明記憶機制確實是“質(zhì)變”的關(guān)鍵因素。

換句話說，Memento證明了：持續(xù)學習≠微調(diào)模型，外部記憶同樣行之有效。

AI智能體的“死穴”，終于找到破解方式？-AI.x社區(qū)

為什么Memento很重要？

從研究走向應(yīng)用，Memento有幾個關(guān)鍵意義：

成本優(yōu)勢不再需要頻繁微調(diào)，節(jié)省海量算力和數(shù)據(jù)。
適應(yīng)性更強Agent可以即時更新記憶，適應(yīng)動態(tài)環(huán)境。
通用性Memento本身是一個框架，可以與不同LLM（如GPT-4.1、o4-mini）結(jié)合。
向AGI邁進一步如果說LLM是“聰明的大腦”，那么Memento就是“記憶的軀體”。兩者結(jié)合，才更接近人類智能。

結(jié)尾：AI的未來，不是更大模型，而是更好“記憶”

Memento展示了一條新的路徑：

我們不必再為模型參數(shù)的“微調(diào)”疲于奔命；
我們可以通過“外部記憶”來賦予AI持續(xù)學習的能力；
更像人類，也更具擴展性。

當AI開始具備這種“經(jīng)驗驅(qū)動的自我進化”后，我們或許就離真正的**通用人工智能（AGI）**更近一步。

問題也隨之而來： ?? 在你看來，未來的AI智能體更需要“更大的大腦”，還是“更持久的記憶”？ ?? 你會希望你的AI助手具備Memento這樣的能力嗎？

本文轉(zhuǎn)載自??Halo咯咯?? 作者：基咯咯

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

已于2025-10-11 06:51:40修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

告別偏科，能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強化智能體終于來了

輕薄滴假象 ? 4138瀏覽 ? 0回復(fù)
GPT Researcher：破解復(fù)雜研究的AI利器

51CTO內(nèi)容精選 ? 5146瀏覽 ? 0回復(fù)
企業(yè)或個人構(gòu)建人工智能上層應(yīng)用的幾種方式，以及每種方式的優(yōu)劣

AI探索時代 ? 3678瀏覽 ? 0回復(fù)
揭開危險的面紗：人工智能可能失控的十種方式以及如何識別

51CTO內(nèi)容精選 ? 4385瀏覽 ? 1回復(fù)
麻省理工研究團隊革新科學研究方式,通過多智能體智能圖推理實現(xiàn)科學發(fā)現(xiàn)自動化

xuxiangda ? 6689瀏覽 ? 0回復(fù)
Entropix，終于找到了真正解決幻覺的方法了

NLP前沿1 ? 3983瀏覽 ? 0回復(fù)
Agent驅(qū)動的AI編程，終于找到了PMF！

探索AGI ? 3717瀏覽 ? 0回復(fù)
AI Agent智能體產(chǎn)品的五個級別

數(shù)智飛輪 ? 1.5w瀏覽 ? 0回復(fù)
AI Agent 智能體開發(fā)工作手冊詳細指南

玄姐聊AGI ? 7879瀏覽 ? 0回復(fù)
微軟提出AutoGen Studio，用低代碼方式開發(fā)智能體

Aceryt ? 4837瀏覽 ? 0回復(fù)
Manus AI ：如何讓AI從 "動口" 到 "動手" 的多智能體架構(gòu)！

Halo咯咯 ? 4582瀏覽 ? 0回復(fù)
AI Agents-3 | AI 智能體的底層架構(gòu)剖析

Halo咯咯 ? 3988瀏覽 ? 0回復(fù)
AI Agents-4 | 一文讀懂 AI 智能體的多元類型

Halo咯咯 ? 3369瀏覽 ? 0回復(fù)
多智能體（Multi Agent）AI系統(tǒng)：企業(yè)智能化轉(zhuǎn)型的未來

Halo咯咯 ? 3715瀏覽 ? 0回復(fù)
關(guān)于RAG和智能體的區(qū)別，從某方面來說智能體也是RAG的一種實現(xiàn)方式

AI探索時代 ? 2153瀏覽 ? 0回復(fù)
微軟rStar2智能體：破解AI推理 “工具噪聲 + GPU 閑置” ，“智能體RL” 14B 逆襲 671B！

十一月雨_55 ? 2844瀏覽 ? 0回復(fù)
AI 智能體在順豐運營場景的落地案例剖析

玄姐聊AGI ? 4296瀏覽 ? 0回復(fù)
下一代智能體，用大腦的方式看世界、走世界

xuxiangda ? 2974瀏覽 ? 0回復(fù)
并行 AI 智能體：改變研發(fā)方式的技術(shù)革新

玄姐聊AGI ? 538瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

為什么「小語言模型」正在取代「大模型崇拜」？ 3天前發(fā)布
深度解析 Evo-Memory 與 ReMem：讓 LLM Agent 在與世界交互時自我進化 3天前發(fā)布

熱門推薦

深度解析 FLUX.2：新一代文生圖模型的架構(gòu)演進與工程實踐 0回復(fù)

深度解析 LLM 推理加速：從 KV Cache 到 Continuous Batching 的演進之路 0回復(fù)

字節(jié)跳動發(fā)布Vidi2，視頻理解能力超越Gemini3 pro 0回復(fù)

告別官方限制！我是如何使用Claude+CodeX協(xié)同工作流“榨干”Claude和CodeX的價值 0回復(fù)

用 Cognee 構(gòu)建端到端知識圖譜，實現(xiàn)當前效果最好的AI Agent記憶層 0回復(fù)

上一篇：代碼已不再稀缺，開發(fā)者正在進入“工作流時代”

下一篇：靜態(tài)工作流已過時？Agentic AI正在接管自動化舞臺

社區(qū)精華內(nèi)容

目錄

精品国产乱码久久久久久婷婷| 欧美私人啪啪vps| 欧美日韩三级在线| 久久日韩粉嫩一区二区三区| 你懂的网址国产欧美| 国产午夜精品福利| 在线播放精品一区二区三区| 国产精品素人一区二区| 国产香蕉一区二区三区在线视频 | 亚洲天堂中文字幕| 性xxxx丰满孕妇xxxx另类| heyzo一区| 中文视频在线| 天堂中文av| 7777免费精品视频| 偷拍亚洲欧洲综合| 日韩中文字幕亚洲| 欧美三级视频在线| 欧美三级免费观看| 欧美精品少妇一区二区三区| 亚洲成年人影院| 综合一区在线| 99精品热视频| 在线视频中文亚洲| 香港三级日本三级a视频| 偷拍精品精品一区二区三区| 久久国产精品72免费观看| 亚洲精品国产精品乱码不99按摩| 色女人综合av| 五月天av在线| 豆国产96在线|亚洲| 欧美日韩性生活| 日本fc2在线观看| 欧美激情麻豆| 国产精品日韩欧美大师| 日本免费视频在线观看| 国产一区二区三区久久| 亚洲乱码av中文一区二区| 99久久免费观看| 美女精品在线观看| 精品捆绑美女sm三区 | 国产九一精品| 天天综合网天天综合色| 在线观看免费黄网站| 欧美电影三区| 日韩欧美久久一区| 亚洲视频1区2区| 欧美tickling挠脚心丨vk| 电影在线一区| 国产精品久久久久久久免费软件 | 国产精品自拍首页| 密臀av在线| 91麻豆精品视频| 国产精品一区二区三区免费视频 | 丁香婷婷综合五月| 久久久久国产一区二区三区| 日韩欧美专区在线| 亚洲精品电影在线观看| 国产黄大片在线观看| 好男人看片在线观看免费观看国语| 国产一区自拍视频| 蜜芽tv福利在线视频| 91小视频网站| 91蝌蚪精品视频| 欧美久久天堂| 日本成人一区| 91福利免费在线| 国产美女三级视频| 最新欧美色图| 3d成人h动漫网站入口| 亚洲欧美日韩不卡| 国产精品一区二区中文字幕| 三级亚洲高清视频| 91久久一区二区| 成人444kkkk在线观看| 99re在线视频这里只有精品| 国产精品一区二区三区四区色| 啦啦啦在线视频免费观看高清中文| 93久久精品日日躁夜夜躁欧美| 在线观看av日韩| 国产欧美日韩影院| 91麻豆桃色免费看| 久久九九精品视频| 欧美一区二区三区影视| 粉嫩虎白女毛片人体| 亚洲一区图片| 国产成人91久久精品| 中文在线8资源库| xvideos亚洲人网站| 成功精品影院| 国产精品国产一区二区| 精品一区二区三区在线观看| 日韩无套无码精品| 奇米综合一区二区三区精品视频| 国产精品第3页| 亚洲日本视频在线| 亚洲欧美精品一区| 日韩av影院| 国产亚洲激情在线| 蜜桃成人av| 欧美国产日韩中文字幕在线| 国产精品一区久久| 久久99精品国产91久久来源| 亚洲国产私拍精品国模在线观看| 亚洲人成小说| 露出调教综合另类| 国产校园另类小说区| 国产精品扒开腿做| 蜜臀99久久精品久久久久久软件| 日韩在线视频观看正片免费网站| 男女羞羞电影免费观看| 日韩欧美成人激情| 成人国产精品久久| 亚洲欧美中文字幕在线一区| 亚洲欧美视频一区二区| 中文字幕久久亚洲| 狠狠爱www人成狠狠爱综合网 | 午夜不卡一区| 亚洲欧洲在线看| 日本女优一区| 国产精品欧美在线| 国产在线精品免费av| 精品人伦一区二区三区| 日本中文字幕在线一区| 北条麻妃99精品青青久久| 欧美日韩免费网站| 欧美午夜精品理论片a级大开眼界欧美午夜精品久久久久免费视 | 狠狠色综合色区| 久久精品水蜜桃av综合天堂| 日韩视频免费观看高清完整版| 亚洲一区二区电影| 国产伦精品一区二区三| 久章草在线视频| 国产成人欧美在线观看| 在线不卡欧美精品一区二区三区| 国产精选一区| 校园春色欧美| 久久精品免视看| 最新真实国产在线视频| 久久老女人爱爱| 嫩草在线视频| 精品一区二区三区视频在线播放| 国产精品一区二区a| 国产精品国产精品国产专区不蜜| 成人一级片网站| 91久久精品国产91性色tv| 果冻天美麻豆一区二区国产| 色综合男人天堂| 国产伦精品一区二区三区免费 | 无码日本精品xxxxxxxxx| 欧美午夜在线观看| 亚洲区小说区图片区qvod| 国产青青在线视频| 国产日韩欧美一区二区三区综合| 麻豆tv在线| 欧美成人综合一区| 91久久精品日日躁夜夜躁欧美| 欧美色就是色| 国产精品一区二区三区精品| 亚洲成人一区在线| 精品亚洲精品| 国产特级嫩嫩嫩bbb| 国自在线精品视频| 亚洲高清二区| 久久免费视频在线| 国产综合网站| 国产aa视频| 国产免费观看久久黄| 成人免费一区二区三区在线观看| 亚洲图区欧美| 国产精品入口夜色视频大尺度| 国产精品久久久久久久久久免费看| 国产亚洲成av人片在线观黄桃| 女性女同性aⅴ免费观女性恋| 夜色激情一区二区| 久久午夜影院| 蜜臀一区二区三区| 欧美一区二区三区婷婷月色| 日韩在线观看一区二区| 久cao在线| 欧美亚洲国产视频小说| 国产精品每日更新| 免费毛片在线看片免费丝瓜视频 | 日韩av大片站长工具| 亚洲国产另类久久久精品极度| 国产蜜臀av在线一区二区三区| 成视频在线观看免费观看| 人人爽久久涩噜噜噜网站| 亚洲激情女人| 久久www人成免费看片中文| 日韩国产精品一区二区三区| 亚洲欧美日韩国产中文在线| 欧美日韩国产欧| a√资源在线| 欧美激情导航| 夜夜嗨av一区二区三区四区| 久久在线观看免费| 日韩毛片视频| 综合久久2019| 国产精品电影一区|

<fieldset id="ygr81"><optgroup id="ygr81"></optgroup></fieldset>

<ol id="ygr81"><optgroup id="ygr81"><center id="ygr81"></center></optgroup></ol><fieldset id="ygr81"></fieldset>

<rp id="ygr81"><address id="ygr81"></address></rp>