国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

ChatGPT真能記住你的話嗎?DeepMind與開源大佬揭示LLM記憶之謎

人工智能 新聞
LLM有記憶能力嗎?有,也沒有。雖然ChatGPT聊天時好像可以記住你之前說的話,但實際上,模型在推理時記不住任何內容,而且它們在訓練時的記憶方式也不像我們想象的那么簡單。

Django框架的創始人之一、著名開發者Simon Willison最近發表了一篇博客文章,核心觀點是——雖然很多LLM看起來有記憶,但本質上是無狀態函數。

圖片

文章地址:https://simonwillison.net/2024/May/29/training-not-chatting/

Mozilla和FireFox的聯合創始人、JavaScript發明者Brendan Eich也在推特上稱贊這篇博客。

圖片

似乎有記憶的LLM

從計算機科學的角度來看,最好將LLM的推理過程視為無狀態函數調用——給定輸入文本,它會輸出接下來應該做什么。

然而使用過ChatGPT或者Gemini的人會明顯感覺到,LLM似乎可以記住之前的對話內容,好像模型有記憶能力。

然而這并不能歸功于模型本身。

事實上,用戶每次提出一個問題時,模型收到的提示都會包含之前所有的對話內容,這些提示就是我們經常說的「上下文」。


如果不提供上下文,LLM將完全不知道之前討論的內容。

所以,重新打開一個對話界面時,對LLM而言就是一個「從頭再來」的全新文本序列,完全獨立于你和其他用戶之前發生的對話。

從另一個角度看,這種「失憶」也有好處。比如,模型開始胡說八道,或者拒絕回答你的合理問題時,就可以試試重置對話窗口。也許在新的對話中,模型的輸出就能回到正軌。

這也是為什么LLM的上下文長度是一個重要的指標。如果對話過長、超出了上下文窗口,最早的那部分對話就會從提示中移除,看起來就像是模型的「遺忘」。

Andrej Karpathy將上下文窗口準確地形容為「LLM工作記憶的有限寶貴資源」。

但是,有很多方法可以為LLM外置記憶能力,來滿足產品使用的需求。

將之前的對話作為提示,和當前問題一起輸入給LLM是最直接的方法,但這依舊是「短期記憶」,而且擴展模型的上下文長度成本很高。

GPT-4o免費版支持8k上下文,付費版可以達到128k,已經比之前的32k提升了3倍,但仍然無法保存單個網頁的原始HTML。

也可以遞歸地總結之前的對話內容,將歷史對話摘要當作LLM提示。雖然可能會丟失細節,但相比直接截斷的方法,更高程度上保留了內容的完整性。

另一種方法是外接矢量數據庫,為LLM添加「長期記憶」。

在進行對話時,先從數據庫中檢索相關內容,再將其添加進上下文窗口,也就是檢索增強生成(RAG)。

但如果數據庫內容過多,檢索過程很可能增加模型的響應延遲。

實際開發中,檢索、摘要這兩種手段常常搭配使用,以求在成本和性能、長期和短期記憶之間取得平衡。

推理無法記憶,但訓練可以

LLM的推理過程雖然等效于「無狀態函數」,但訓練過程并不是這樣,否則它也無法從語料中學習到任何知識。

但我們對于LLM記憶的分歧之處在于,它到底是用「機械」的方式復制了訓練數據,還是更像人類的學習過程,用理解、概括的方式將數據內容集成在參數中。

DeepMind近期發表的一篇論文或許可以從另一個角度揭示這個問題。

圖片

論文地址:https://arxiv.org/abs/2404.15146

他們使用與訓練語料相似的prompt攻擊LLM,看它能否逐字逐句地輸出訓練數據。

但Falcon、Llama、Mistral這種常用的半開放LLM,以及GPT系列都沒有公開訓練數據,要怎么判斷模型的輸出是否包括在訓練集中?

論文使用了一種巧妙的方法進行判斷:首先,從RefinedWeb、RedPajama、Pile等常用的LLM預訓練數據集中選取了9TB的文本作為輔助數據集。

如果模型輸出的文本序列足夠長、信息熵又足夠大,而且還和輔助數據集內容重合,那么基本可以斷定模型在訓練時見過這條數據。

這樣的判斷方法會存在假陰性,因為輔助數據集不可能涵蓋所有模型的訓練數據,但幾乎沒有假陽性,因此得到的結果可以作為模型「復現」訓練內容的比例下界。

結果發現,所有的模型都能逐字逐句地輸出訓練數據,只是概率有所差異。

從結果可以發現,參數量越大的模型似乎記住的內容越多,越有可能在輸出中讓訓練數據回流。

不同系列的模型之間差異比較顯著。比如7B參數的Mistral相比Falcon,有將近10倍的概率原樣吐出訓練數據。

但可能的原因有很多,既能解釋為模型記憶能力的差距,也能歸因于為輔助數據集的偏差。

有趣的是,如果prompt的要求是一直持續輸出某個單詞,有些單詞更有可能觸發模型吐出訓練數據。


最有效的一個單詞是「company」

作者指出,從安全的角度來看,這說明對齊過程沒有完全模糊模型的記憶,這些可提取的訓練數據會帶來版權糾紛與隱私泄露問題。

但從另一個角度來看,這證明,一定比例的訓練數據被無損壓縮而且存儲在了模型參數中。模型的記憶方式,果然是有些「機械化」的成分。

更進一步思考,如果改進LLM的記憶方式,讓訓練數據以更概括、更抽象的方式存儲在參數中,能否帶來模型能力的持續提升?

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-12-08 08:16:59

ChatGPT開源商業化

2024-07-12 14:07:04

2025-10-14 09:54:28

2010-08-16 10:48:47

2012-07-05 09:33:32

WPSOpenOffice開源

2023-05-18 16:09:06

2024-12-12 08:42:25

2016-08-04 16:30:49

華為

2025-06-27 08:56:51

2024-11-18 10:25:00

AI模型

2024-07-03 09:38:35

LLM人工智能

2024-02-04 13:56:03

2025-04-23 08:00:00

Wi-Fi有線網絡網線

2025-08-06 06:15:00

2023-06-30 09:00:00

Falcon LLM開源

2025-05-16 10:17:54

2022-09-29 23:57:54

機器學習人工智能統計學

2024-07-08 09:00:00

2023-02-27 10:45:16

2017-08-07 15:43:42

點贊
收藏

51CTO技術棧公眾號

欧美性xxx| 国产二区三区在线| 巨乳诱惑日韩免费av| 久久久久久久激情视频| 麻豆视频在线观看免费网站黄| 精品国产1区2区| a优女a优女片| 国产精品麻豆99久久久久久| 日韩欧美不卡在线| 涩涩视频在线播放| 日韩一级精品视频在线观看| 国产精品秘入口| 精品高清美女精品国产区| 久久国产情侣| 国产精品私人自拍| 深夜黄色小视频| 久久午夜老司机| 蜜臀av午夜一区二区三区| 风间由美一区二区三区在线观看| 超碰成人在线免费观看| 日韩国产精品91| 性刺激综合网| 日韩国产欧美在线视频| 久久国产精品 国产精品| 午夜视频一区| 99中文字幕| 欧美三级不卡| 精品亚洲第一| 爽爽淫人综合网网站| 国产亚洲情侣一区二区无| 欧美a级一区| 99一区二区三区| 亚洲三级影院| 日产精品久久久一区二区| 美女网站在线免费欧美精品| 影音先锋成人资源网站| 国产成人丝袜美腿| 黄色一级免费大片| 日韩美女啊v在线免费观看| 五月天丁香婷| 在线观看视频91| 久久亚洲导航| 国产亚洲激情视频在线| 国产精品成人3p一区二区三区 | 精品乱码一区二区三区四区| 色久欧美在线视频观看| 精品中文视频| 国产精品2018| 国产精品videosex极品| 日本一区不卡| 99精品黄色片免费大全| 上原亚衣加勒比在线播放| 亚洲动漫第一页| 黄色片免费在线观看| 精品无人区太爽高潮在线播放| 久久久免费人体| 日韩av免费在线播放| 一本色道久久综合| 岛国大片在线播放| 一二三四社区欧美黄| 日本蜜桃在线观看| 在线视频亚洲欧美| 欧美丝袜激情| 五月婷婷综合色| 国产欧美日韩激情| 性刺激综合网| 国产精品美女久久久久久| 加勒比一区二区三区在线| 亚洲国产精品中文| 欧美一级二级三级视频| 国产精品一区二区三区在线 | 99久久久久| 日韩av电影免费在线观看| 99精品热视频| 香蕉av一区| 亚洲人成在线电影| 日本不卡免费一区| 亚洲欧洲精品一区二区三区波多野1战4| 91蝌蚪porny成人天涯| 蜜桃视频在线观看网站| 亚洲免费影视第一页| 国产一区二区三区站长工具| 亚洲精品国产精品国自产观看| 国产精品日日摸夜夜摸av| 免费av毛片在线看| 91超碰中文字幕久久精品| 青青国产91久久久久久| 涩涩视频免费网站| 亚洲国产毛片完整版| 色999国产精品| 免费av观看网址| 欧美一区二区不卡视频| 日本精品影院| 又大又硬又爽免费视频| 欧美日韩第一区日日骚| 亚洲福利网站| 国产成人一区二区三区别| 91国偷自产一区二区开放时间 | 一区二区三区免费| 国产一区二区三区视频在线| 欧美成人免费高清视频| 亚洲国产精品女人久久久| 91精品网站| 2020国产精品| 色呦呦在线资源| 国产精品成久久久久三级| www.欧美日韩| av在线免费网址| 国产精品永久免费观看| 久久久久成人黄色影片| 成人福利影视| 亚洲已满18点击进入在线看片| 国产午夜精品一区二区| 55av亚洲| 精品在线视频一区二区| 一区二区三区欧美激情| 国产在线不卡一区二区三区| 日韩欧美国产二区| 欧美综合视频在线观看| 国产麻豆一区二区三区精品视频| av免费播放网址| 亚洲欧美综合v| 青娱乐精品视频在线| 日韩专区在线| 18成人在线| 婷婷六月综合网| 精品高清久久| а√最新版在线天堂| 欧美激情小视频| 久久综合999| а天堂中文最新一区二区三区| 国产精品视频网站在线观看| 日韩成人av网址| 精品无人码麻豆乱码1区2区| 国产精品一二三产区| 亚洲精品成人自拍| 亚洲精品v欧美精品v日韩精品 | 国产91大片| 欧美黑人巨大xxx极品| 97se亚洲国产综合自在线观| 69堂免费精品视频在线播放| 菠萝蜜视频在线观看入口| 亚洲欧美日韩一区二区三区在线| 久久99精品一区二区三区三区| 国产色婷婷在线| 成年人黄色在线观看| 亚洲人成在线免费观看| 成人精品一区二区三区中文字幕| www.一区| 日韩免费高清在线| 午夜伦理精品一区| 亚洲一区在线播放| 午夜精品av| 五月天婷婷在线视频| 亚洲福利av在线| 亚洲天堂av在线免费观看| 91美女视频网站| 色哟哟精品丝袜一区二区| 欧美日夜夜逼| 国内精品视频免费| 日韩高清免费在线| xf在线a精品一区二区视频网站| 国产另类在线| 在线视频福利| 成人国产一区二区| 欧美xingq一区二区| zzijzzij亚洲日本少妇熟睡| 黄色成人美女网站| 黄色美女网站在线观看| 亚洲精品高清视频| 另类少妇人与禽zozz0性伦| 亚洲蜜臀av乱码久久精品蜜桃| 亚洲国产精品综合久久久 | 亚洲精品国产视频| 国产精品www994| 久草在线中文最新视频| 成人在线激情网| 成人综合网网址| 日韩精品中午字幕| 99精品欧美| 国产精品乱码一区二区三区软件| 99久久99久久精品免费看蜜桃| 欧美—级a级欧美特级ar全黄| 中文在线免费一区三区高中清不卡| 精品国产中文字幕第一页| 黄色在线网站| 8x8ⅹ国产精品一区二区二区| 天使と恶魔の榨精在线播放| avtt综合网| 亚洲人成在线影院| 久久久久久久999| 日韩欧美国产高清91| 蜜芽一区二区三区| 日本一区精品视频| 成人综合影院| 亚洲五月天综合| 免费在线成人av电影| 免费一区二区视频| 日韩av在线免播放器| 免费91在线视频|