国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長 原創 精華

發布于 2025-11-13 08:34
瀏覽
0收藏

過去幾年,我們見證了一個趨勢——無論是企業部署AI,還是研究機構訓練大模型,大家都在拼命“微調”。但問題是:微調成本太高、周期太長,還容易過擬合。 那有沒有一種方法,讓模型在不改動參數的情況下,依然能“變聰明”?

最近,來自斯坦福大學、UC Berkeley和SambaNova Systems的研究團隊,提出了一個顛覆性方案——Agentic Context Engineering(ACE)。 它讓模型的成長,不再靠重新訓練,而是靠上下文自我進化

這不是又一個Prompt技巧,而是一個完整的、自循環的“智能體自我改進框架”。 更令人震驚的是:在多個基準測試中,ACE在**性能提升超10%、推理延遲下降高達86.9%**,甚至用開源模型打平了GPT-4.1的成績。

一、從“微調”到“上下文進化”:ACE到底改了什么?

我們先看清楚ACE的核心理念。 在傳統方法里,要讓大模型在某個領域變強,常見做法是:

收集數據 → 調參微調 → 部署新版本

但ACE提出:不改模型參數,只改“輸入上下文”。 這聽起來像“Prompt工程”的升級版,但ACE更進一步:它把上下文當作一個會成長的記憶系統(playbook)

??ACE的哲學:上下文是“活”的

ACE把模型使用的上下文拆成了一個“活的知識庫”,由三種角色持續維護:

  1. Generator(生成者)負責執行任務,產出推理軌跡、工具調用過程與結果。
  2. Reflector(反思者)復盤生成者的行為,總結出“哪些策略有效、哪些無效”。
  3. Curator(策展人)把這些經驗加工成一個個帶標簽的“小增量片段(delta item)”,再合并進“上下文手冊”中。

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

每一次任務的執行,都會讓上下文變得更聰明。 這就像一個人不斷記錄自己的成功與失敗,形成獨特的決策經驗。 而模型的“能力提升”,其實就是它的上下文不斷被優化的過程。

二、Generator→Reflector→Curator:模型的“自我學習閉環”

ACE的工作機制可以看作一個小型的智能生態系統。 它不靠反復訓練,而是靠信息循環和增量積累。

1?? Generator:行動者

Generator負責執行具體任務,比如代碼生成、財務推理、信息檢索等。 在執行過程中,它會記錄下自己的推理路徑(Reasoning Trace),包括:

  • 哪一步用了什么工具;
  • 哪種策略成功了;
  • 哪些嘗試導致了失敗。

這些軌跡數據就是后續反思的“原材料”。

2?? Reflector:復盤者

Reflector的角色相當于一個“分析師”。 它閱讀這些執行軌跡,總結出具體經驗,比如:

  • 哪種思路在某類任務中更高效;
  • 哪種Prompt模式容易出錯;
  • 如何調整指令結構避免無效操作。

它提煉出的這些經驗被稱為“lessons”,是模型理解世界的基礎單元。

3?? Curator:策展者

Curator會把Reflector的經驗轉化為結構化的“delta items”。 這些小片段帶有類型(如策略、風險、偏好)和計數器(幫助/損害次數)。 再通過去重、合并、剪枝等機制,構建出一個不斷演化的“上下文手冊”。

這一步是ACE的關鍵創新:

  • 它不推翻舊內容;
  • 而是像版本控制一樣“增量合并”;
  • 從而避免上下文崩塌(context collapse)。

最終,ACE形成了一個“持續學習”的閉環系統—— 模型自己用經驗更新上下文,用更新后的上下文指導下次行動。

三、性能數據:ACE用開源模型挑戰GPT-4.1

這套框架到底效果如何? 研究團隊在多個真實環境中測試了ACE,結果令人震撼。

?? AppWorld(智能體任務)

在AppWorld智能體基準中,ACE基于ReAct框架構建(即ReAct+ACE),與多個強力基線模型對比:

模型

平均得分

延遲優化

模型類型

GEPA

基線

反思-演化Prompt

Dynamic Cheatsheet

基線

動態記憶

ReAct+ACE

+10.6%

?82.3%延遲 / ?75.1%滾動

DeepSeek-V3.1

IBM CUGA (GPT-4.1)

60.3%

閉源商業模型

??結果顯示:ReAct+ACE達到了59.4%的分數,僅次于GPT-4.1的60.3%,但用的是開源的DeepSeek-V3.1。而在“挑戰集(test-challenge split)”上,ACE甚至超過了GPT-4.1的表現。

這意味著:模型不必升級版本,只要上下文不斷自我優化,就能逼近SOTA性能。

四、在金融推理任務中,ACE依然強勢

除了智能體任務,團隊還在金融數據集(FiNER、XBRL Formula)上測試了ACE的適應性。

結果顯示:

  • 平均性能提升 +8.6%
  • 在僅有執行反饋的弱監督場景中依然有效
  • 但性能會隨反饋質量波動,體現出ACE對“信號質量”的敏感性

這表明,ACE不僅適合交互型智能體,還能遷移到結構化推理、金融分析等高價值場景

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

五、速度與成本:省下90%的計算開銷

在適應速度和成本上,ACE展現了驚人的效率。

任務

延遲降低

Token成本降低

對比對象

AppWorld(離線)

?82.3%

?75.1%

GEPA

FiNER(在線)

?91.5%

?83.6%

Dynamic Cheatsheet

換句話說,ACE幾乎把適應成本砍掉了九成。 原因在于它的合并與更新機制都不依賴模型推理,只是簡單的“結構化上下文操作”。 這讓它非常適合本地化部署、低資源場景,甚至可用于企業私域Agent系統。

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

六、ACE的真正意義:從“訓練模型”到“養成模型”

ACE的提出,標志著一個重要轉變:

AI能力不再來源于算力堆疊,而是上下文的持續進化。

它讓模型像一個有記憶的個體,通過行動—反思—整理的循環,自我生長。 這不僅意味著模型可以“自養”,也預示著一種新的AI架構哲學:

  • 不再需要頻繁更新checkpoint;
  • 任務經驗可被長期積累;
  • 模型生態可通過上下文復用實現“持續強化”。

未來的智能體,可能會像人類一樣,靠經驗而非訓練變強。

七、局限與展望

當然,ACE并非萬能。 它的表現依賴于任務反饋的質量,如果反思階段得到的信號不準,就可能積累錯誤經驗。 此外,隨著上下文不斷增長,如何在保持效率的同時維持信息密度,也將成為新的研究方向。

但它的啟發意義無疑是深遠的: 在模型參數越來越難更新、數據越來越私有化的當下,ACE提供了一條讓模型自我演化的“輕路徑”。


?本文轉載自???Halo咯咯???    作者:基咯咯

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
www视频在线看| 在线欧美不卡| 欧美精品色一区二区三区| 亚洲老女人av| 蜜臀av一区二区在线免费观看 | 少妇精品久久久久久久久久| 91精品国产自产精品男人的天堂| 日韩精品一区二区三区四区视频| 视频在线国产| 中文字幕在线一区免费| 亚洲国产精品无码av| 麻豆免费精品视频| 精品无人区一区二区三区| 国产精品久久久久久麻豆一区软件| 久久天天躁狠狠躁夜夜av| www成人免费观看| 欧美一区二区三区男人的天堂| 青青免费在线视频| 黑人巨大精品欧美一区二区| 国产免播放器视频| 亚洲婷婷综合久久一本伊一区| 国产精品99久久免费黑人人妻| aaa欧美色吧激情视频| 欧美aaa在线观看| 麻豆精品国产91久久久久久| 亚洲国产一区二区精品视频| 丝袜亚洲另类欧美综合| 久久综合久久久| 欧美高清一区| 国产伦视频一区二区三区| 欧美精品麻豆| 国产综合18久久久久久| 亚洲日本免费| 久久久婷婷一区二区三区不卡| 一本久久知道综合久久| 欧美一区国产一区| 国内精品国产三级国产a久久| 男女裸体影院高潮| av中文字幕亚洲| 亚洲黄色小视频在线观看| 国产嫩草影院久久久久| www.男人的天堂.com| 亚洲综合久久久久| 国产对白叫床清晰在线播放| 日韩一区国产二区欧美三区| 色偷偷偷在线视频播放| 久久久999精品视频| 欧美国产极品| 国产精品国产精品| 麻豆成人91精品二区三区| 精品少妇在线视频| 亚洲伦在线观看| 国产午夜在线观看| 亚洲精品日韩欧美| 中文在线综合| 亚洲一区中文字幕在线观看| 日本成人在线电影网| 国产真实乱子伦| 动漫精品一区二区| 午夜裸体女人视频网站在线观看| 欧美成人亚洲成人日韩成人| 亚洲品质自拍| 日本视频一区在线观看| 久久蜜臀精品av| 完全免费av在线播放| 精品亚洲国产视频| 米奇777超碰欧美日韩亚洲| 久久国产精品99久久久久久丝袜| 高潮精品一区videoshd| 国产美女在线播放| 亚洲精品成人久久电影| 欧美成人基地| 日韩成人在线资源| 亚洲欧洲精品一区二区三区不卡| 精品av中文字幕在线毛片| 亚洲网站在线看| 日韩精品dvd| 狠狠噜天天噜日日噜| 亚洲国产aⅴ成人精品无吗| h片在线观看视频免费| 日本高清+成人网在线观看| 久久国产精品毛片| 69久久久久久| 精品99久久久久久| 教室别恋欧美无删减版| 亚洲一区影院| 欧美日韩在线视频观看| 日韩专区视频网站| 精品久久久久久一区| 国产精品网站导航| 国产福利在线免费观看| 国产日韩在线一区| 91最新地址在线播放| 日本中文字幕在线2020| 午夜欧美大片免费观看| 日本不卡123| 亚洲成人影院在线观看| 久久人体大胆视频| 久久久国产亚洲精品| 黄页网址在线观看| 久久精品国产69国产精品亚洲 | 欧美一级免费播放| 91九色02白丝porn| 欧美三级午夜理伦三级在线观看| 午夜精品一区二区在线观看| 亚洲成年人网站在线观看| 日韩另类视频| 欧美一级日本a级v片| 亚洲国产一区二区a毛片| 精品国产不卡一区二区| 一本—道久久a久久精品蜜桃| 欧美伊人久久久久久久久影院 | 亚洲乱亚洲乱妇无码| 99精品视频在线观看播放| 久久久久久久激情| 亚洲精品小视频| 久久国产66| www亚洲人| 91精品免费久久久久久久久| 中文字幕亚洲区| 一区二区三区在线免费看| 隔壁人妻偷人bd中字| 亚洲国产福利在线| 国产精品日韩欧美一区| 九色网友自拍视频手机在线| 国产精品久久久久久亚洲影视 | 国产成人亚洲综合a∨猫咪| 九九在线视频| 国产精品欧美一区二区| 国产精品久久久久久久久免费相片| 欧美精品资源| 日本免费黄色小视频| 亚洲国产精品999| 日韩精品1区2区3区| 麻豆网站在线免费观看| 国产精品一区视频| 日韩欧美在线免费观看| 久久资源中文字幕| 草久在线视频| 国产精品爽黄69| 亚洲理论在线观看| 国产91精品对白在线播放| 国产真实生活伦对白| 性色av一区二区三区在线观看| 国产亚洲欧洲一区高清在线观看| 国产成人免费av一区二区午夜| 国产夫妻自拍一区| 国产一区二区激情| 97se亚洲国产综合自在线不卡| 欧美成人毛片| 黑人粗进入欧美aaaaa| 午夜精品福利视频| 亚洲欧美日韩国产中文在线| 欧美日韩一二三四| 国产51人人成人人人人爽色哟哟| 国产精品三区四区| 日韩欧美另类在线| 国产精品99久久久久久久女警| 成人天堂yy6080亚洲高清| 青青在线视频观看| 国产不卡精品视男人的天堂| 精品成人在线视频| 欧美一级专区| 91另类视频| 黄色国产网站| 国产精品一区在线播放| 亚洲国产精品va在看黑人| 99亚偷拍自图区亚洲| 伊人成综合网伊人222| 视频一区二区在线播放| 九九九久久久| 中文字幕日韩在线播放| 亚洲欧洲日韩女同| 影音国产精品| 日韩国产网站| 国产美女免费观看| 精品一区二区视频| 夜夜躁日日躁狠狠久久88av| 中文字幕一区二区三区在线不卡| 亚洲成人一区| 涩涩涩在线视频| 能在线观看的av| 国产精品视频自在线| 91精品免费观看| 成人ar影院免费观看视频| 禁断一区二区三区在线| av网站导航在线观看免费| 你懂的av在线| 成人免费视频网址| 亚洲美女黄色片| 一区二区三区免费在线观看| 亚洲女人av| 成人h动漫精品一区二区器材| 暖暖视频在线免费观看| 欧美少妇在线观看| 国产精品爽黄69天堂a| 亚洲精品一二区| 亚洲成人免费在线| 国产一区二区免费看| 九九久久成人|