国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

200萬token上下文能力,并且越用越聰明!Google Research重構AI長期記憶

人工智能 新聞
Google Research發布的Titans架構通過在推理階段實時訓練深層神經網絡模塊,讓AI擁有了處理超過200萬token上下文的能力,并在MIRAS框架下統一了序列建模的數學理論。

Transformer架構提出者,為谷歌提供基礎研究、算法與生態底座的Google Research,要讓AI擁有長期記憶。

Google Research發布的Titans架構通過在推理階段實時訓練深層神經網絡模塊,讓AI擁有了處理超過200萬token上下文的能力,并在MIRAS框架下統一了序列建模的數學理論。

Google Research推出的Titans架構與MIRAS框架通過讓模型在推理過程中實時更新參數,實現了超越GPT-4的長文本記憶能力與極高的運行效率。

打破Transformer的算力魔咒與記憶瓶頸

人工智能領域長期存在一個類似于魚和熊掌不可兼得的困境。

Transformer架構憑借注意力機制徹底改變了序列建模,它讓模型能夠回溯之前的輸入,精準地抓取相關信息。

這種機制賦予了AI強大的短期記憶和理解能力,但也帶來了一個致命的弱點:隨著輸入序列長度的增加,計算成本呈現爆發式增長。

想要讓模型理解整本小說、分析完整的基因組序列,或者處理超長的法律文檔,Transformer的資源消耗會迅速變為天文數字。

為了解決這個問題,研究界探索了線性遞歸神經網絡(RNNs)和狀態空間模型(SSMs),例如Mamba-2。

這些模型的優勢在于速度,它們將上下文壓縮成固定大小的狀態,實現了快速的線性擴展。

這種做法雖然換來了速度,卻犧牲了精度。

固定大小的壓縮像是一個容量有限的行囊,當旅途過長,新的信息不斷涌入,舊的細節就會被迫丟棄,模型無法捕捉超長序列中那些豐富而微妙的信息。

Google Research提出的Titans架構和MIRAS框架,不僅僅是修補現有模型,而是重新定義了記憶的本質。

Titans是具體的工具,一種結合了RNN速度與Transformer精度的全新架構;MIRAS則是理論藍圖,一個將不同序列模型統一起來的通用框架。

這兩者結合,讓AI擁有一種名為測試時記憶的能力。

模型不再是一個訓練好就固化的靜態系統,它能夠在運行時,根據信息的新穎程度和重要性,實時更新自己的核心記憶,無需專門的離線再訓練。

這標志著AI從被動存儲信息向主動學習和適應的轉變。

Titans架構:像大腦一樣用驚奇感學習

一個高效的學習系統需要涇渭分明又相互連接的記憶模塊,這正如人類大腦區分短期記憶和長期記憶一樣。

注意力機制擅長處理精準的短期記憶,而Titans引入了一種全新的神經長期記憶模塊。

傳統的RNN試圖將記憶塞進一個固定大小的向量或矩陣中,這限制了信息的承載量。

Titans打破了這一限制,它使用一個深度神經網絡(具體來說是多層感知機)作為記憶模塊。

這不僅僅是存儲空間的擴大,更是記憶方式的質變。

這個記憶模塊擁有極高的表達能力,能夠對海量信息進行深度總結,而不丟失關鍵的上下文。

模型不再是機械地記錄每一個字,而是在理解和合成整個故事的脈絡。

Titans最核心的機制在于它是如何決定記住什么的。

它不被動接收數據,而是主動識別并保留那些能夠連接整個輸入序列的重要關系和概念主題。

這種主動性依賴于一種被稱為驚奇度量(Surprise Metric)的機制。

在人類心理學中,我們很容易忘記那些例行公事的、意料之中的日常瑣事,但對于那些打破常規、出乎意料或者極具情感沖擊力的事件,記憶卻異常深刻。Titans借鑒了這一原理。

在Titans的運行邏輯中,驚奇度量是指模型檢測到的當前記憶與新輸入信息之間的巨大差異。

當模型接收到一個新詞,比如貓,而它當前的記憶狀態已經預期會出現一個動物詞匯時,這種差異很小,梯度(即驚奇度)就很低。

模型會認為這是一個常規信息,不需要浪費寶貴的長期記憶資源去專門存儲它。

相反,如果模型的記憶狀態正在處理一份嚴肅的財務報告,突然輸入了一張香蕉皮的圖片,這種巨大的反差會產生極高的梯度。

這個高梯度信號就是模型內部的報警器,它在數學上大聲疾呼:這是意料之外的重要信息。

于是,模型會優先將這一信息刻入長期記憶模塊。

這種利用內部誤差信號(梯度)來指導記憶更新的方法,讓Titans能夠極其高效地篩選信息。

它只選擇性地更新那些最新穎、最能打破現有上下文的信息,從而保持了整體處理過程的快速與高效。

為了進一步完善這一機制,Titans融入了兩個關鍵要素。

首先是動量(Momentum)。

模型在判斷信息重要性時,不僅看當前的瞬間驚奇,還會考量過去的驚奇積累,即最近的上下文流。

這確保了那些雖然單個看起來不那么驚人,但作為后續相關信息基礎的內容也能被捕捉到。

其次是遺忘機制(權重衰減)。

面對無限延伸的序列,任何記憶系統的容量終究是有限的。

Titans采用自適應權重衰減作為一種遺忘門,允許模型主動丟棄那些不再需要的信息,為新知識騰出空間。

MIRAS框架:序列建模的統一場論

如果我們透過現象看本質,會發現序列建模領域的每一次重大突破,從現代Transformer到最新的線性RNN,其底層邏輯驚人地一致:它們都是某種形式的高度復雜的聯想記憶模塊。

基于這一洞察,MIRAS框架應運而生。

它不再將各種模型視為互不相關的架構,而是將它們看作解決同一個問題的不同方法——即如何在不遺忘核心概念的前提下,高效地將新信息與舊記憶融合。

MIRAS通過四個關鍵的設計選擇來定義一個序列模型。

首先是記憶架構,即存儲信息的結構,它可以是向量、矩陣,也可以是像Titans那樣深度的多層感知機。

其次是注意力偏差,這是模型優化的內部學習目標,決定了模型優先關注什么。

第三是保留門,即記憶正則化器。

MIRAS將傳統的遺忘機制重新解釋為一種正則化形式,用于在學習新知識和保留舊知識之間尋找平衡。

最后是記憶算法,即用于更新記憶的具體優化算法。

現有的成功序列模型幾乎都依賴均方誤差(MSE)或點積相似度來處理偏差和保留。

這種對傳統歐幾里得幾何范式的依賴,使得模型對異常值非常敏感,同時也限制了模型的表達能力。

MIRAS超越了這一局限,它提供了一個生成式框架,引入了優化理論和統計學文獻中的豐富設計空間。

這使得研究人員可以探索非歐幾里得的目標函數和正則化方法,從而創造出全新的架構。

基于MIRAS框架,研究團隊設計了三種無注意力機制的新模型變體。

YAAD旨在降低對重大錯誤或異常值的敏感度,例如大文檔中的個別拼寫錯誤。

它使用Huber損失函數作為一種更溫和的數學懲罰,避免模型對一次性問題反應過度,從而在面對雜亂或不一致的數據時更加穩健。

MONETA則探索了更復雜、更嚴格的數學懲罰(廣義范數)。

它研究了這種更具紀律性的規則是否能帶來更強大、更穩定的長期記憶系統。

MEMORA專注于實現最佳的記憶穩定性,它強制記憶像嚴格的概率圖一樣運作。

通過這種約束,它確保每次記憶狀態更新都是受控且平衡的,從而保證了新信息整合過程的清晰與穩定。

深度記憶的力量與未來展望

通過嚴格的對比實驗,Titans及其MIRAS變體(YAAD, MONETA, MEMORA)展現出了超越Transformer++、Mamba-2和Gated DeltaNet等領先架構的實力。

這種優勢不僅體現在標準的語言建模任務(如C4, WikiText)中,在零樣本推理任務(如HellaSwag, PIQA)中,這些模型也一致表現出了更高的準確性和更低的困惑度。

困惑度是衡量大語言模型在面對一段文本時驚訝程度的指標,數值越低,說明模型的預測越準確,理解力越強。

消融研究揭示了一個關鍵發現:記憶架構的深度至關重要。

當對比大小相同但深度不同的長期記憶模塊時,更深層的記憶模塊始終能實現更低的困惑度。

更重要的是,它們展現出了更好的擴展性。隨著序列長度的大幅增加,深度記憶模塊依然能保持優異的性能,沒有出現常見的性能衰減。

在語言建模和常識推理任務中,Titans架構的表現優于同等規模的最先進線性遞歸模型和Transformer++基線。MIRAS的新變體也證明了探索非MSE優化機制的價值。值得注意的是,這些模型在提升性能的同時,依然保持了高效的并行訓練能力和快速的線性推理速度。Titans不僅僅局限于文本,在基因組建模(DNA)和時間序列預測等任務上的測試表明,這套架構具有強大的通用性。

這些新架構最顯著的優勢在于處理極端長上下文的能力。

BABILong基準測試是一項極具挑戰性的任務,要求模型在分布于超長文檔中的事實之間進行推理。

在這個高難度設定下,Titans擊敗了所有基線模型,包括參數量巨大無比的GPT-4。

盡管Titans的參數量要少得多,它卻展示了有效擴展到超過200萬token上下文窗口的能力。這意味著AI在處理海量信息時,不再需要為了速度而犧牲記憶的準確性。

Titans架構與MIRAS框架的推出,是序列建模領域的一次重大飛躍。

通過使用深度神經網絡作為記憶模塊,并讓模型在數據輸入時實時學習和記憶,這些方法徹底克服了固定大小遞歸狀態的局限。

MIRAS提供的理論統一,揭示了在線優化、聯想記憶與架構設計之間深層的內在聯系。

通過跳出標準的歐幾里得范式,這項研究為新一代序列模型打開了大門。

未來的AI模型將兼具RNN的高效與Transformer的表達力,真正從容應對長上下文時代的挑戰。

責任編輯:張燕妮 來源: AIGC開放社區
相關推薦

2025-09-18 10:10:31

2025-07-01 08:37:13

2021-09-06 14:53:15

人工智能機器學習技術

2025-05-09 09:15:00

2024-07-25 12:35:33

2025-10-13 01:22:00

2024-07-29 07:04:00

大模型AI訓AI人工智能

2025-05-15 09:16:00

2021-09-29 15:36:43

人工智能算法AI

2021-02-22 11:00:39

機器學習人工智能AI

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-05-26 08:30:00

2025-08-29 14:17:01

ClaudeOpenAIGemini

2023-07-28 12:13:28

模型語言性能

2023-08-10 14:04:15

代碼模型

2023-09-16 13:47:47

人工智能數據

2025-10-15 02:00:00

2024-02-20 13:31:46

模型數據

2024-04-29 13:09:10

LLM架構性能

2025-08-08 01:45:00

上下文工程優化框架
點贊
收藏

51CTO技術棧公眾號

日本高清无吗v一区| aaa在线播放视频| 蜜乳av另类精品一区二区| 亚洲第一综合网站| 国产乱码精品1区2区3区| 国产日韩av在线播放| 国产精品一区二区免费在线观看| 啪一啪鲁一鲁2019在线视频| 2022成人影院| 91精品国产色综合久久| 国产素人视频在线观看| 青娱乐极品盛宴一区二区| 欧美性受xxxx白人性爽| 中文字幕在线免费观看视频| 亚洲日本成人女熟在线观看 | 国产精品久久久爽爽爽麻豆色哟哟| av磁力番号网| 香蕉久久国产| 国产九九在线视频| 欧美午夜性色大片在线观看| 老司机午夜在线| 久久久久久香蕉网| 亚洲神马久久| 男人的天堂www| 亚洲国产成人av网| 99久久精品一区二区成人| 91欧美精品午夜性色福利在线 | 欧美三级电影在线观看| 欧洲av一区二区| 91亚洲精品久久久久久久久久久久| 成人精品视频一区二区三区| 91ph在线| 78色国产精品| 99精品国产热久久91蜜凸| 风间由美一区| 国产主播喷水一区二区| 国产午夜精品理论片a级大结局| 伊人免费在线| 成人精品久久久| 日韩理论片在线| 9i看片成人免费高清| 官网99热精品| 狠狠躁夜夜躁久久躁别揉| 久久aimee| 制服国产精品| 日本不卡免费高清视频| 国产www.大片在线| 精品久久五月天| 日本一区二区在线看| 欧美精品久久久久久久久久久| 欧美午夜丰满在线18影院| 色琪琪久久se色| 四虎4hutv紧急入口| 久久久精品国产网站| 国产一区二区久久| 忘忧草在线影院两性视频| 一区二区三区久久网| 欧美性高清videossexo| 亚洲国产清纯| 在线不卡日本v二区707| 免费av在线一区二区| 日韩欧美高清dvd碟片| 日本网站在线观看一区二区三区 | 成人免费黄色网页| 国产精品久久精品国产| 欧美午夜精品免费| 日韩精品电影一区亚洲| 欧洲一级精品| 97影院理论| 国产精品久久精品视| 亚洲国产高清高潮精品美女| 国产一区二区三区久久久| 欧洲亚洲精品| 永久免费不卡在线观看黄网站| 成人黄色av播放免费| 欧亚一区二区三区| 激情都市一区二区| 无码国模国产在线观看| 污视频网站在线| 一区二区三区视频在线播放| 久久视频这里只有精品| 色婷婷精品久久二区二区蜜臀av| 日本亚洲最大的色成网站www| 欧美亚洲黄色| 成人日韩欧美| 老太脱裤让老头玩ⅹxxxx| 国产第一区电影| 日韩久久精品电影| 亚洲另类中文字| 国产精品18久久久久久久网站| 欧美性生活一级片| 成人在线免费看片| 国产成人精品久久二区二区91| 精品亚洲精品福利线在观看| 欧美日韩国产综合新一区| 成人综合婷婷国产精品久久蜜臀 | 美女久久一区| 同性恋视频一区| 成年人视频免费在线播放| 情se视频网在线观看| 青青青青在线视频| 欧美污视频久久久| 青青在线视频一区二区三区| 国产亚洲欧洲高清一区| 欧美一级搡bbbb搡bbbb| 好吊成人免视频| 亚洲成av人综合在线观看| 亚洲丝袜另类动漫二区| 国产网红主播福利一区二区| 国产一区二区久久| 国产自产视频一区二区三区| 激情丁香综合| 激情五月***国产精品| 97久久视频| 国内成人自拍| 青青草国产成人a∨下载安卓| 国产成人福利av| 久久精品福利| 欧美日韩激情| 亚洲国产精品久久久久蝴蝶传媒| 亚洲国产合集| 欧美肉体xxxx裸体137大胆| 亚洲精品亚洲人成在线| 国产日产精品一区二区三区四区的观看方式 | 激情综合一区二区三区| 国产精品亚洲专一区二区三区| 奇米综合一区二区三区精品视频| 欧美一级网站| 国产精品1区2区3区| 成人精品电影在线观看| 中文字幕av不卡| 一区二区三欧美| 粉嫩tv在线播放| 在线免费av播放| 免费av一级电影| 极品美乳网红视频免费在线观看| 亚洲一区在线日韩在线深爱| 日韩福利一区二区| 国产欧美久久久久久久久| 国产精选在线| 一本色道69色精品综合久久| 亚州综合一区| 亚洲激情一区| 成人午夜av影视| 亚洲欧美一区二区不卡| 欧美亚洲日本一区| 精品国产sm最大网站免费看| 午夜精品福利视频| 91免费在线观看网站| 久久手机在线视频| 日本三级电影网| 天堂中文在线播放| 99热国内精品| 99久久99久久精品国产片果冻| 精品国产福利视频| 在线成人中文字幕| 精品久久sese| 九色丨porny丨| 交100部在线观看| 91九色精品国产一区二区| 久久久久久久综合| 精品无码久久久久久国产| 琪琪亚洲精品午夜在线| 亚洲综合激情五月| 欧美日本网站| 97视频一区| 久久新电视剧免费观看| 日韩精品影音先锋| 国产一区自拍视频| 国产经典视频一区| 青草综合视频| 国产精品一区二区三区乱码 | 理论在线观看| 国产一区二区三区四区五区| 国产精品乱人伦一区二区| 久久精品电影网| 国产精品视频网站在线观看 | 亚洲欧洲综合另类| 欧美国产日本高清在线 | 国产成人欧美日韩在线电影| 精品免费国产一区二区三区四区| 亚洲精品日韩激情在线电影| 调教在线观看| 欧美久久久久| 在线综合+亚洲+欧美中文字幕| 成人免费在线看片| 天堂а√在线资源在线| 爽好久久久欧美精品| 亚洲视频综合网| 波多野结衣av一区二区全免费观看| 欧美free嫩15| 成人欧美一区二区三区视频网页| 91av视频在线观看| 日av在线播放| 亚洲欧美不卡| 久久久国产一区二区三区| 日本成人黄色网| 国产精品久久久久久久免费软件| 亚洲成人黄色在线观看| www.日本在线视频|