国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

斯坦福新論文:微調已死,自主上下文當立

人工智能 新聞
來自斯坦福大學、SambaNova Systems公司和加州大學伯克利分校的研究人員,在新論文中證明: 依靠上下文工程,無需調整任何權重,模型也能不斷變聰明。

是時候為傳統(tǒng)微調獻上挽歌了。

一項全新研究,剛剛又給微調致命一擊。

來自斯坦福大學、SambaNova Systems公司和加州大學伯克利分校的研究人員,在新論文中證明:

依靠上下文工程,無需調整任何權重,模型也能不斷變聰明。

他們提出的方法名為智能體上下文工程ACE

ACE不依賴模型重新訓練,而是讓上下文自主進化,通過反復生成、反思并編輯自己的提示,直至成為一個自我完善的系統(tǒng)。

在智能體和特定領域的基準測試中,ACE能同時優(yōu)化離線上下文(如system prompt)和在線上下文(如agent memory),并穩(wěn)定優(yōu)于強力基線模型。

下面具體來看。

ACE框架

現在很多AI應用(比如自動處理財務數據的工具、能調用APP的智能助手)都靠 “上下文適配” 來提升能力。

簡單來說,就是不給模型改底層參數,而是在輸入里加指令、策略或證據,但老方法有兩個大問題:

簡潔偏置

為了讓輸入簡短,把關鍵細節(jié)丟了。比如只說 “處理財務數據”,卻沒說 “要按XBRL格式核對數值”,導致模型犯錯。

上下文崩潰

反復修改輸入時,模型會把之前積累的有用信息越改越短、越改越沒用。比如原本有1.8萬個token的實用策略,準確率為66.7,改一次就剩122個token,效果卻下降到57.1。

ACE就是為了解決這兩個問題來的,與將知識壓縮為簡短摘要或靜態(tài)指令的方法不同,它將上下文視為不斷演化的操作手冊,能夠隨時間不斷累積、優(yōu)化并組織策略。

基于Dynamic Cheatsheet的智能體設計,ACE把模型的 “上下文優(yōu)化” 拆成分工明確的三個角色。

  • 生成器(Generator):負責生成推理軌跡;
  • 反思器(Reflector):負責從成功和錯誤中提煉具體見解;
  • 整理器(Curator):負責將這些見解整合到結構化的上下文更新中。

如上圖所示,工作流程首先由生成器針對新查詢生成推理軌跡,這些軌跡既能呈現有效策略,也會暴露常見錯誤。

隨后,反思器對這些軌跡進行評析,從中提煉出經驗教訓,并可選擇通過多輪迭代加以優(yōu)化。

接著,整理器將這些經驗合成為簡潔的增量條目,再經由輕量級的非LLM邏輯,以確定性的方式將其合并至現有上下文中。

由于更新內容被逐項分解并局部化,多個增量得以并行合并,從而實現大規(guī)模的批量適應。

此外,ACE還支持多輪次適應機制,即對同一組查詢進行反復學習,逐步強化上下文質量。

ACE在兩大場景中全面超越基線

實驗結果表明,在智能體和財務分析兩大場景中,ACE穩(wěn)定優(yōu)于Base LLM(無適配)、ICL(少樣本演示)、GEPA(主流prompt優(yōu)化)、Dynamic Cheatsheet(動態(tài)備忘單)等方法。

在智能體測試中,研究團隊采用的是AppWorld,它是一套自主智能體任務集合,涵蓋API理解、代碼生成和環(huán)境交互。

結果顯示,ReAct+ACE相比ReAct+ICL和ReAct+GEPA分別領先12.3%和11.9%,優(yōu)勢顯著。這表明,與固定的演示示例或單一優(yōu)化指令提示相比,結構化、可演進且精細化的上下文能夠更有效地促進智能體學習。

這一優(yōu)勢在在線場景中同樣得以延續(xù):ACE平均以7.6%的性能提升領先于Dynamic Cheatsheet等現有自適應方法。

在財務分析中,研究者選用FiNER和Formula來測評模型的金融推理能力,其任務依賴可擴展商業(yè)報告語言(XBRL)。

  • FiNER要求對XBRL財務文檔中的token進行標注,將其歸類為139種細粒度實體類型之一,這是在受監(jiān)管領域進行金融信息抽取的關鍵步驟。
  • Formula則側重于從結構化XBRL報告中提取數值,并通過計算回答金融查詢,即進行數值推理任務。

在離線環(huán)境下,當模型獲得訓練集中的真實答案作為輸入時,ACE以平均10.9%的優(yōu)勢明顯超越了ICL、MIPROv2和GEPA。

此外,ACE在降低自適應成本(如嘗試次數和token輸入/生成的費用)與延遲方面展現出顯著優(yōu)勢。

具體而言,在AppWorld的離線自適應任務中,與GEPA相比,ACE將自適應延遲降低了82.3%,并將嘗試次數減少了75.1%。

在FiNER的在線自適應場景中,與DC相比,ACE實現了91.5%的自適應延遲降低,并在token輸入與生成的相關費用上節(jié)省了83.6%。

華人出品

這項研究的兩位一作都是華人。

Qizheng Zhang,斯坦福大學計算機科學系四年級博士生。此前在芝加哥大學獲得了數學、計算機科學和統(tǒng)計學三個專業(yè)的學士學位。

本科期間,他就與Junchen Jiang和Ravi Netravali兩位教授合作開展計算機網絡研究,專注于面向視頻流與分析的網絡系統(tǒng)設計。

此外,他還在美國阿貢國家實驗室數學與計算機科學部(MCS)和微軟研究院實習過。

Changran Hu,本科畢業(yè)于清華大學,碩士畢業(yè)于加州大學伯克利分校。

20歲時,他就成為了一家AI音樂生成公司DeepMusic的聯合創(chuàng)始人,成功獲得來自中國頂級企業(yè)的1000萬美元投資,并與多位中國流行歌手(如周杰倫、李健)建立合作。

隨后,他以應用科學家實習生的身份加入微軟,并于2021年成為Sambanova Systems研究工程師,隨后晉升為技術主管兼經理,主要負責模型后訓練與智能體AI相關研發(fā)工作。

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-10-11 18:05:23

AI智能體模型

2025-10-31 16:06:19

AI參數微調

2025-10-20 09:06:00

2023-10-18 09:25:08

模型推理

2025-05-09 07:50:30

2023-06-15 15:45:42

自然語言語言模型

2025-10-14 09:54:28

2025-10-13 09:03:00

2023-07-18 14:18:00

Attention模型圖像

2023-07-28 12:13:28

模型語言性能

2017-05-11 14:00:02

Flask請求上下文應用上下文

2024-12-10 09:07:17

2012-12-31 10:01:34

SELinuxSELinux安全

2022-09-14 13:13:51

JavaScript上下文

2023-11-15 13:40:00

訓練數據

2023-07-24 12:27:08

論文斯坦福

2023-10-23 13:23:03

數據訓練

2012-03-21 21:38:27

蘋果

2009-05-19 09:06:41

Apple斯坦福iPhone

2013-01-31 09:45:14

斯坦福超級電腦百萬內核
點贊
收藏

51CTO技術棧公眾號

国产精品一区在线观看| 91色p视频在线| 妞干网在线视频| 国产麻豆精品一区二区| 国产精品我不卡| 久久综合影院| 欧美做受高潮电影o| 国产一区二区三区精品在线观看| 欧美一级免费大片| 青青草观看免费视频在线| 久久精品一区二区三区不卡牛牛 | 欧美日韩精品综合| 亚洲经典一区| 亚洲最大的av网站| 香蕉国产精品| 亚洲自拍偷拍色图| 99成人精品| 麻豆亚洲一区| 免费日韩视频| 日本精品二区| 久久久久免费| 欧美中文娱乐网| 羞羞视频在线观看欧美| 亚洲精品中字| 狠狠色狠狠色合久久伊人| 中文字幕av日韩精品| 成人网在线免费视频| 免费国产黄色网址| 久久精品视频在线看| 丁香激情视频| 亚洲伊人色欲综合网| a天堂中文在线官网| 国产精品青草综合久久久久99| 亚洲性图一区二区| 亚洲欧美日韩国产手机在线 | 欧美精品中文字幕一区| 日韩精品免费一区二区夜夜嗨| 91av在线不卡| 久久国产亚洲精品| 欧美精品与人动性物交免费看| 肉丝袜脚交视频一区二区| 一区二区三区在线视频111| 日本伊人色综合网| 国产aaa一级片| 亚洲欧美日韩电影| 黄色免费在线播放| 国产丝袜精品视频| 99精品国产九九国产精品| 97免费中文视频在线观看| 亚洲欧洲一级| 免费cad大片在线观看| 久久久久久99久久久精品网站| 日韩精品一区二区三区四| 国产精品欧美久久久久无广告| 超碰在线一区二区三区| 欧美高清性hdvideosex| 黄色污网站在线观看| 久久99精品久久久久久琪琪| 我不卡神马影院| 欧美性潮喷xxxxx免费视频看| 亚洲嫩草精品久久| 麻豆传媒在线免费| 欧美极品少妇与黑人| 欧美日韩ab| www.xxx麻豆| 9久草视频在线视频精品| 最美情侣韩剧在线播放| 亚洲精品国产福利| 北条麻妃一区二区三区在线| 久久国产精品免费一区| 国产成+人+日韩+欧美+亚洲| 香港日本韩国三级| 亚洲精品日韩丝袜精品| 日韩一级电影| 久久精品ww人人做人人爽| av一区二区不卡| 欧美zzoo| 久久国产精品99国产精| 成人免费av| 99在线免费视频观看| 欧美日韩亚洲系列| av今日在线| 亚洲自拍偷拍区| 成人av动漫在线| av电影在线播放高清免费观看| 亚洲电影免费观看| 日韩激情啪啪| 这里只有精品66| 亚洲观看高清完整版在线观看 | 999久久久免费精品国产| 亚洲一卡二卡三卡| 亚洲婷婷国产精品电影人久久| 日韩伦理在线| 91久久综合亚洲鲁鲁五月天| zzijzzij亚洲日本少妇熟睡| melody高清在线观看| 午夜精品一区二区三区在线 | 国产精品久久精品视| 不卡在线视频中文字幕| 欧美18一19xxx性| 2019中文字幕全在线观看| 久久精品国产一区二区| 黄色三及免费看| 亚洲欧美日韩精品久久| 欧美日韩国产亚洲一区| 欧美一级视频免费看| 精品国内片67194| 日韩视频一区二区| 国产精品丝袜一区| 欧美一区二区三| www.久久99| 台湾天天综合人成在线| 国产黄页在线观看| 国产美女永久无遮挡| 亚洲欧洲一区二区三区久久| 久久97久久97精品免视看秋霞| 欧美日韩另类综合| 亚洲女同ⅹxx女同tv| 桃子视频成人app| 国产精品日韩欧美一区二区| 亚洲va欧美va人人爽| 91成人在线精品视频| a级网站在线观看| 亚洲成人三级在线| 制服诱惑一区二区| 超碰在线12| 国产一区香蕉久久| 亚洲色图.com| 你懂的在线观看一区二区| 日韩亚洲欧美视频| 日韩av最新在线观看| 亚洲作爱视频| 老司机在线永久免费观看| 成人性生交xxxxx网站| 久久精品一区八戒影视| 精品嫩草影院| 欧美精品无码一区二区三区| 欧美福利小视频| 久久精品视频一区二区| 中文字幕综合| 91在线视频观看免费| 午夜一区二区三区在线观看| 日韩欧美三级在线| 综合欧美亚洲日本| 日韩av在线发布| 亚洲精品社区| 桃色一区二区| 在线伊人免费视频| 成人禁在线观看网站| 黄色网在线视频| 精品国产乱码久久久久| 国产精品免费观看在线| 欧美一区在线视频| 国产日韩欧美一区二区三区| 香蕉视频亚洲一级| 午夜在线免费观看视频| 黄页网址大全在线观看| 国产精品久久久久7777| 精品999在线观看| 中文字幕亚洲字幕| 久久99久久99精品中文字幕| 作爱视频免费观看视频在线播放激情网| 无码精品国产一区二区三区免费| 欧美理论片在线观看| 中文字幕亚洲欧美一区二区三区| 欧美va亚洲va国产综合| 欧美视频日韩视频在线观看| 在线免费av一区| 91搞黄在线观看| 精品裸体舞一区二区三区| 日韩精品中文字幕在线观看 | 色综久久综合桃花网| 亚洲国产精品女人久久久 | 日本高清不卡一区二区三| 国产日韩1区| 久久婷婷国产| 亚洲一区电影| heyzo欧美激情| 日韩电影在线观看一区| 一区二区三区四区激情| 欧美在线视频你懂得| 欧美成va人片在线观看| 久久久在线视频| 国产精选一区二区| 丰满爆乳一区二区三区| 黄视频网站在线观看| 日韩成人影院| 色综合色综合色综合色综合色综合| 欧美日韩电影在线观看| 8x8x华人在线| 久久久国产成人精品| 久久艹在线视频| 国产视频一视频二| 最新欧美色图| 久久超碰97人人做人人爱| 欧日韩精品视频| 国产精品偷伦视频免费观看国产| 日韩a在线播放| 男人av在线| 色偷偷偷在线视频播放|