国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長 原創 精華

發布于 2025-11-13 08:34
瀏覽
0收藏

過去幾年,我們見證了一個趨勢——無論是企業部署AI,還是研究機構訓練大模型,大家都在拼命“微調”。但問題是:微調成本太高、周期太長,還容易過擬合。 那有沒有一種方法,讓模型在不改動參數的情況下,依然能“變聰明”?

最近,來自斯坦福大學、UC Berkeley和SambaNova Systems的研究團隊,提出了一個顛覆性方案——Agentic Context Engineering(ACE)。 它讓模型的成長,不再靠重新訓練,而是靠上下文自我進化

這不是又一個Prompt技巧,而是一個完整的、自循環的“智能體自我改進框架”。 更令人震驚的是:在多個基準測試中,ACE在**性能提升超10%、推理延遲下降高達86.9%**,甚至用開源模型打平了GPT-4.1的成績。

一、從“微調”到“上下文進化”:ACE到底改了什么?

我們先看清楚ACE的核心理念。 在傳統方法里,要讓大模型在某個領域變強,常見做法是:

收集數據 → 調參微調 → 部署新版本

但ACE提出:不改模型參數,只改“輸入上下文”。 這聽起來像“Prompt工程”的升級版,但ACE更進一步:它把上下文當作一個會成長的記憶系統(playbook)

??ACE的哲學:上下文是“活”的

ACE把模型使用的上下文拆成了一個“活的知識庫”,由三種角色持續維護:

  1. Generator(生成者)負責執行任務,產出推理軌跡、工具調用過程與結果。
  2. Reflector(反思者)復盤生成者的行為,總結出“哪些策略有效、哪些無效”。
  3. Curator(策展人)把這些經驗加工成一個個帶標簽的“小增量片段(delta item)”,再合并進“上下文手冊”中。

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

每一次任務的執行,都會讓上下文變得更聰明。 這就像一個人不斷記錄自己的成功與失敗,形成獨特的決策經驗。 而模型的“能力提升”,其實就是它的上下文不斷被優化的過程。

二、Generator→Reflector→Curator:模型的“自我學習閉環”

ACE的工作機制可以看作一個小型的智能生態系統。 它不靠反復訓練,而是靠信息循環和增量積累。

1?? Generator:行動者

Generator負責執行具體任務,比如代碼生成、財務推理、信息檢索等。 在執行過程中,它會記錄下自己的推理路徑(Reasoning Trace),包括:

  • 哪一步用了什么工具;
  • 哪種策略成功了;
  • 哪些嘗試導致了失敗。

這些軌跡數據就是后續反思的“原材料”。

2?? Reflector:復盤者

Reflector的角色相當于一個“分析師”。 它閱讀這些執行軌跡,總結出具體經驗,比如:

  • 哪種思路在某類任務中更高效;
  • 哪種Prompt模式容易出錯;
  • 如何調整指令結構避免無效操作。

它提煉出的這些經驗被稱為“lessons”,是模型理解世界的基礎單元。

3?? Curator:策展者

Curator會把Reflector的經驗轉化為結構化的“delta items”。 這些小片段帶有類型(如策略、風險、偏好)和計數器(幫助/損害次數)。 再通過去重、合并、剪枝等機制,構建出一個不斷演化的“上下文手冊”。

這一步是ACE的關鍵創新:

  • 它不推翻舊內容;
  • 而是像版本控制一樣“增量合并”;
  • 從而避免上下文崩塌(context collapse)。

最終,ACE形成了一個“持續學習”的閉環系統—— 模型自己用經驗更新上下文,用更新后的上下文指導下次行動。

三、性能數據:ACE用開源模型挑戰GPT-4.1

這套框架到底效果如何? 研究團隊在多個真實環境中測試了ACE,結果令人震撼。

?? AppWorld(智能體任務)

在AppWorld智能體基準中,ACE基于ReAct框架構建(即ReAct+ACE),與多個強力基線模型對比:

模型

平均得分

延遲優化

模型類型

GEPA

基線

反思-演化Prompt

Dynamic Cheatsheet

基線

動態記憶

ReAct+ACE

+10.6%

?82.3%延遲 / ?75.1%滾動

DeepSeek-V3.1

IBM CUGA (GPT-4.1)

60.3%

閉源商業模型

??結果顯示:ReAct+ACE達到了59.4%的分數,僅次于GPT-4.1的60.3%,但用的是開源的DeepSeek-V3.1。而在“挑戰集(test-challenge split)”上,ACE甚至超過了GPT-4.1的表現。

這意味著:模型不必升級版本,只要上下文不斷自我優化,就能逼近SOTA性能。

四、在金融推理任務中,ACE依然強勢

除了智能體任務,團隊還在金融數據集(FiNER、XBRL Formula)上測試了ACE的適應性。

結果顯示:

  • 平均性能提升 +8.6%
  • 在僅有執行反饋的弱監督場景中依然有效
  • 但性能會隨反饋質量波動,體現出ACE對“信號質量”的敏感性

這表明,ACE不僅適合交互型智能體,還能遷移到結構化推理、金融分析等高價值場景

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

五、速度與成本:省下90%的計算開銷

在適應速度和成本上,ACE展現了驚人的效率。

任務

延遲降低

Token成本降低

對比對象

AppWorld(離線)

?82.3%

?75.1%

GEPA

FiNER(在線)

?91.5%

?83.6%

Dynamic Cheatsheet

換句話說,ACE幾乎把適應成本砍掉了九成。 原因在于它的合并與更新機制都不依賴模型推理,只是簡單的“結構化上下文操作”。 這讓它非常適合本地化部署、低資源場景,甚至可用于企業私域Agent系統。

大模型不再靠“微調”進化:斯坦福提出ACE框架,用“上下文”讓智能體自我成長-AI.x社區

六、ACE的真正意義:從“訓練模型”到“養成模型”

ACE的提出,標志著一個重要轉變:

AI能力不再來源于算力堆疊,而是上下文的持續進化。

它讓模型像一個有記憶的個體,通過行動—反思—整理的循環,自我生長。 這不僅意味著模型可以“自養”,也預示著一種新的AI架構哲學:

  • 不再需要頻繁更新checkpoint;
  • 任務經驗可被長期積累;
  • 模型生態可通過上下文復用實現“持續強化”。

未來的智能體,可能會像人類一樣,靠經驗而非訓練變強。

七、局限與展望

當然,ACE并非萬能。 它的表現依賴于任務反饋的質量,如果反思階段得到的信號不準,就可能積累錯誤經驗。 此外,隨著上下文不斷增長,如何在保持效率的同時維持信息密度,也將成為新的研究方向。

但它的啟發意義無疑是深遠的: 在模型參數越來越難更新、數據越來越私有化的當下,ACE提供了一條讓模型自我演化的“輕路徑”。


?本文轉載自???Halo咯咯???    作者:基咯咯

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
国产成人精品免费在线| 欧美在线激情网| 日韩精品另类天天更新| 亚洲综合欧美激情| 国产精品毛片大码女人| 免费av观看网址| 国产无遮挡一区二区三区毛片日本| 亚洲国产精品综合| 国产一区网站| 6080亚洲精品一区二区| 美女视频黄a视频全免费观看| 视频二区欧美| 国产精品igao| 国产亚洲一区二区三区在线播放| 亚洲精品一线二线三线无人区| 天堂亚洲精品| 在线日韩av片| av片在线看| 国内高清免费在线视频| a√中文在线观看| 亚洲日韩欧美视频一区| 国产欧美视频在线| 一区二区三区四区精品视频| 亚洲精品va在线观看| 亚洲综合在线电影| 日韩欧美中文字幕在线播放| 久久婷婷开心| 免费看男男www网站入口在线| 国产亚洲一区| 欧美一区国产二区| xxx亚洲日本| 免费观看亚洲| 中文乱码字幕高清在线观看| 你懂的视频欧美| 五月激情丁香一区二区三区| 国产精品日韩一区二区三区 | 中文在线免费视频| 日本丰满少妇黄大片在线观看| 国产麻豆一区二区三区| 国产精品成人免费精品自在线观看| 亚洲精品在线免费观看视频| 亚洲欧美激情一区二区| 国产日韩精品视频| av免费在线一区| 色嗨嗨av一区二区三区| 91精品国产91久久久久久| 黄色片久久久久| 洋洋av久久久久久久一区| aaa免费看大片| 影音先锋男人的网站| 福利在线视频网站| 麻豆精品在线看| 久久婷婷综合激情| 成人影院大全| 国产精品hd| 久久午夜a级毛片| 四虎在线观看| 免播放器亚洲一区| 成人免费短视频| 久久久久一区| 日韩中文在线字幕| 成人激情电影在线| 你懂的视频在线| 亚洲第一黄色网| 在线视频亚洲自拍| 久久成人一区| 91麻豆桃色免费看| 亚洲爱爱视频| 日韩精品一区二区在线| 国产一级成人av| 97国产一区二区| 国产噜噜噜噜噜久久久久久久久| 欧美人与牛zoz0性行为| 5g国产欧美日韩视频| 巨大黑人极品videos精品| 6080亚洲精品一区二区| 欧美人与禽性xxxxx杂性| 久久久久久久久久久久电影| 午夜影院网站| 欧美日韩精品欧美日韩精品| av黄色在线网站| 中文字幕在线免费专区| 一本大道久久a久久精二百 | 91精品视频网站| 国产精品亚洲二区| 国产精品黄页免费高清在线观看| 亚洲图色一区二区三区| 欧美肥臀大乳一区二区免费视频| 欧美尤物美女在线| 日韩中文字幕欧美| 图片小说视频色综合| 久久国产精品久久精品| 在线观看小视频| 福利微拍一区二区| 松下纱荣子在线观看| 国产成人亚洲综合| 国产精品2024| 久久久噜噜噜久久中文字幕色伊伊 | 69av在线视频| 99人久久精品视频最新地址| 精品国产一二三四区| 色综合视频在线观看| 日韩精品一区二区三区中文字幕| 久久久久久久久久久久久久一区 | 久久久久久久久久美女| 中文字幕在线三区| 国产女同一区二区| 欧美国产精品久久| 毛片免费看不卡网站| 国产精品久久久对白| 亚洲人成网站色在线观看| 国产69精品久久| 在线免费一区| 91麻豆精品91久久久久同性| 亚洲成av人电影| 国产男女爽爽爽| av亚洲精华国产精华精| 国产三级在线免费| 国产xxx69麻豆国语对白| 综合久久久久| 国产精品欧美风情| 成人午夜电影网站| 一区二区高清免费观看影视大全 | 欧美激情欧美| 欧美日韩亚洲第一| 久久综合久久久久| 久久精品国产美女| 亚洲精品一卡二卡| 日本天堂免费a| 亚洲午夜激情在线| 国产h色视频在线观看| 色综合亚洲精品激情狠狠| 另类中文字幕网| 9999精品成人免费毛片在线看| 精品国产一区二区三区麻豆免费观看完整版 | 日韩一区二区免费视频| 一本色道久久综合狠狠躁的番外| 无码人妻少妇伦在线电影| 日韩精品欧美激情| 国内精品写真在线观看| 欧美人与性动交α欧美精品图片| 91牛牛免费视频| 一本色道久久综合亚洲aⅴ蜜桃| 热久久天天拍国产| 三级视频在线播放| 国产精品视频自在线| 欧美视频一区二区三区| 亚洲免费网址| 在线精品一区二区| 亚洲美女电影在线| 成人国产精品久久久久久亚洲| 国产欧美日韩在线视频| 懂色av一区二区| 美女无遮挡网站| 国产日韩精品在线观看| 色综合久久天天综合网| 日韩视频二区| 新版的欧美在线视频| 日本www在线视频| 97精品国产97久久久久久免费 | 亚洲曰韩产成在线| 亚洲一区 二区 三区| 精产国品自在线www| 中文字幕日韩高清| 精品久久久亚洲| 日韩电影在线观看完整版| 精品欧美一区二区在线观看视频| 91精品国产美女浴室洗澡无遮挡| 激情综合色综合久久| 亚洲一区电影| 丝袜视频国产在线播放| 日韩高清av| 超在线视频97| 日韩欧美亚洲成人| 九九国产精品视频| 一级特黄视频| 久久精品综合一区| 中文字幕亚洲国产| 一区二区三区日韩在线观看| 亚洲视频日本| 亚洲天堂电影| 午夜免费啪视频观看视频| 欧美日韩精品久久久免费观看| 国产aⅴ精品一区二区三区久久| 欧美电影免费观看高清完整| 97成人超碰| 盗摄系列偷拍视频精品tp| 日韩精品一区二区三区色偷偷| 国产欧美一区二区| 高潮白浆女日韩av免费看| 久久国产高清| 136福利精品导航| 国产区av在线| 黄色一级片在线看| 亚洲一区视频在线| 久久精品电影| 日韩三级视频| 黄色在线网站噜噜噜| 在线看三级网站视频| 免费人成在线观看视频播放|