国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

谷歌新架構(gòu)一戰(zhàn)成名,打破Transformer記憶瓶頸,姚班校友鐘沛林新作

人工智能 新聞
OpenAI 把它用在推理(Reasoning),谷歌這次把它用在了記憶(Memory)。

想挑戰(zhàn) Transformer 的新架構(gòu)有很多,來自谷歌的“正統(tǒng)”繼承者 Titan 架構(gòu)更受關(guān)注。

圖片

英偉達(dá)把測試時(shí)間計(jì)算(Test-time Computing)稱為大模型的第三個(gè) Scaling Law。

OpenAI 把它用在推理(Reasoning),谷歌這次把它用在了記憶(Memory)。

一作Ali Behrouz表示:

Titans 比 Transformers 和現(xiàn)代線性 RNN 更高效,并且可以有效地?cái)U(kuò)展到超過 200 萬上下文窗口,性能比 GPT4、Llama3 等大模型更好。

他還解釋了這篇研究的動機(jī),團(tuán)隊(duì)認(rèn)為 Transformer 中的注意力機(jī)制表現(xiàn)為短期記憶,因此還需要一個(gè)能記住很久以前信息的神經(jīng)記憶模塊。

圖片

新的長期記憶模塊

提到記憶,大家可能會想到 LSTM、Transformer 等經(jīng)典模型,它們從不同角度模擬了人腦記憶,但仍有局限性:

  • 要么將數(shù)據(jù)壓縮到固定大小的隱狀態(tài),容量有限
  • 要么可以捕捉長程依賴,但計(jì)算開銷隨序列長度平方級增長

并且,僅僅記住訓(xùn)練數(shù)據(jù)在實(shí)際使用時(shí)可能沒有幫助,因?yàn)闇y試數(shù)據(jù)可能在分布外。

為此,Titans 團(tuán)隊(duì)打算將過去信息編碼到神經(jīng)網(wǎng)絡(luò)的參數(shù)中,訓(xùn)練了一個(gè)在線元模型(Online meta-model),該模型學(xué)習(xí)如何在測試時(shí)記住/忘記特定數(shù)據(jù)。

他們從神經(jīng)心理學(xué)中汲取靈感,設(shè)計(jì)了一個(gè)神經(jīng)長期記憶模塊,它借鑒了人腦原理:

  • 意料之外的事件(即“驚喜”)更容易被記住。
  • 驚喜程度由記憶模塊對輸入的梯度來衡量,梯度越大說明輸入越出人意料。
  • 引入動量機(jī)制遺忘機(jī)制,前者將短期內(nèi)的驚喜累積起來形成長期記憶,后者可以擦除不再需要的舊記憶,防止記憶溢出。
  • 記憶模塊由多層 MLP 組成,可以存儲深層次的數(shù)據(jù)抽象,比傳統(tǒng)的矩陣記憶更強(qiáng)大。

圖片

這種在線元學(xué)習(xí)范式,避免了模型記住無用的訓(xùn)練數(shù)據(jù)細(xì)節(jié),而是學(xué)到了如何根據(jù)新數(shù)據(jù)調(diào)整自己,具有更好的泛化能力。

另外,團(tuán)隊(duì)還驗(yàn)證了這個(gè)模塊可以并行計(jì)算

圖片

如何將這個(gè)強(qiáng)大的記憶模塊融入深度學(xué)習(xí)架構(gòu)中呢?

為此,Titans 提出了三種變體:

MAC,記憶作為上下文

將長期記憶和持久記憶(編碼任務(wù)知識的不變參數(shù))作為當(dāng)前輸入的上下文,一起輸入給 attention。

圖片

MAG,記憶作為門

在記憶模塊和滑動窗口 attention 兩個(gè)分支上進(jìn)行門控融合。

圖片

MAL,記憶作為層

將記憶模塊作為獨(dú)立的一層,壓縮歷史信息后再輸入給 attention。

圖片

在實(shí)驗(yàn)中,發(fā)現(xiàn)每種方法都有自己的優(yōu)缺點(diǎn)。

Titans 在語言建模、常識推理、時(shí)間序列預(yù)測等任務(wù)上全面超越 Transformer 和 Mamba 等各路架構(gòu)的 SOTA 模型。

并且僅靠長期記憶模塊(LMM,Long-term Memory Module)本身,就在多個(gè)任務(wù)上擊敗基線。

證明了即使沒有短期記憶(也就是 Attention),該機(jī)制也具備獨(dú)立學(xué)習(xí)的能力。

圖片

在長文本中尋找細(xì)粒度線索的“大海撈針”測試中,序列長度從 2k 增加到 16k,準(zhǔn)確率保持在 90% 左右。

圖片

但團(tuán)隊(duì)認(rèn)為,這些通用的測試已經(jīng)體現(xiàn)不出 Titans 在長文本上的優(yōu)勢。

在另一項(xiàng)需要對分布在極長文檔中的事實(shí)做推理的任務(wù)中,Titans 表現(xiàn)超過了 GPT4 、Mamba 等,以及 Llama3.1 + RAG 的系統(tǒng)。

圖片

另外在時(shí)間序列預(yù)測、DNA 序列建模等特定任務(wù)中,Titans 也取得不錯(cuò)的表現(xiàn)。

三位作者來自 Google Research NYC 算法和優(yōu)化團(tuán)隊(duì),目前還沒被合并到 Google DeepMind。

一作是 Ali Behrouz 來自康奈爾大學(xué)的實(shí)習(xí)生。

圖片

鐘沛林是清華姚班校友,博士畢業(yè)于哥倫比亞大學(xué),2021 年起加入谷歌任研究科學(xué)家。

2016 年,鐘沛林本科期間的一作論文被頂會 STOC 2016 接收,是首次有中國本科生在 STOC 上發(fā)表一作論文。

圖片

領(lǐng)隊(duì)的 Vahab Mirrokni 是 Google Fellow 以及 VP。

圖片

團(tuán)隊(duì)表示 Titians 是用 Pytorch 和 Jax 中實(shí)現(xiàn)的,打算很快提供用于訓(xùn)練和評估模型的代碼。

論文地址:https://arxiv.org/abs/2501.00663v1

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-01-14 17:23:08

2021-02-22 15:23:25

模型人工智能

2021-04-25 15:28:31

黑客安全網(wǎng)絡(luò)

2024-01-26 12:48:49

AI數(shù)據(jù)

2011-06-29 15:50:58

Watson危險(xiǎn)邊緣Power7

2025-05-15 09:02:00

2025-06-09 08:52:00

2025-11-17 08:48:00

AI模型Meta

2025-11-10 08:52:00

模型谷歌架構(gòu)

2025-01-16 08:20:00

2010-03-09 13:56:53

TD終端瓶頸

2023-06-02 13:23:27

谷歌研究

2011-08-16 10:53:02

2010-02-25 14:07:19

2021-10-12 16:46:59

ArrayList接口LinkedList

2025-02-11 09:15:00

AI模型訓(xùn)練

2017-12-04 23:00:24

Windows開發(fā)者軟件

2015-05-18 10:53:33

2025-12-09 08:36:43

2023-11-28 14:00:00

模型數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲色精品三区二区一区| 亚洲第一主播视频| 国产精品久久久久av蜜臀| 日韩黄色视屏| 黄色www在线观看| 成人激情电影一区二区| 日韩视频免费在线观看| 欧美探花视频资源| 国产精品国模大尺度视频| 奇米888四色在线精品| 超碰cao国产精品一区二区| 日韩精品分区| 日本国产在线| 少妇一级淫免费放| 欧美在线观看黄| 国产在线资源一区| 国产精品久久久久久久久久99 | 中文字幕亚洲情99在线| 91麻豆精品国产综合久久久久久| 一区二区三区美女视频| 自拍偷拍亚洲综合| 国产亚洲成aⅴ人片在线观看| 性欧美长视频| 国产亚洲综合精品| 亚洲欧美日韩一区在线观看| 欧美激情无毛| 精品不卡视频| 亚洲激情一区| 最新成人av网站| 99久久亚洲精品蜜臀| 久久理论电影| 欧美激情 亚洲a∨综合| 成年人视频在线看| 成人高清免费在线| 毛片电影在线| 视频在线日韩| 99精品在免费线中文字幕网站一区| 电影一区中文字幕| 亚洲性视频在线| 深爱激情综合网| 亚洲婷婷在线| 一区二区三区四区电影| 全国精品久久少妇| 国产一区二区三区久久久 | 欧美曰成人黄网| 亚洲国产成人在线视频| 亚洲国产成人一区| youjizz亚洲| 亚洲一级免费观看| wwwxxx黄色片| jlzzjlzz欧美| 国产福利在线| 黄色影院在线看| 国产成人77亚洲精品www| 一区二区日韩欧美| 欧美裸体xxxx极品少妇| 91大神在线播放精品| 国产精品久久精品| 日本中文不卡| 女人另类性混交zo| www亚洲人| 久久精品嫩草影院| 图片小说视频色综合| 激情综合色丁香一区二区| 久久久久久久久久看片| 欧美日韩精品欧美日韩精品 | 久久久国产精华液999999| 91久久电影| 久久久久亚洲精品国产| 人妖精品videosex性欧美| 欧美视频小说| 在线观看亚洲色图| 午夜在线激情影院| 亚洲a一区二区三区| www一区二区| 日韩欧美国产三级| 国内外成人免费激情在线视频网站 | 在线观看一区二区视频| 久久亚洲影音av资源网| 97人人模人人爽人人少妇| 欧美色图色综合| caoporn97在线视频| 精品一区二区三区在线| av成人老司机| 欧美成人a视频| 国产伦精品免费视频| 成人精品小视频| 日韩影片中文字幕| 日韩极品在线观看| 欧美日韩一区二区三区高清| 国产精品久久久久久影视| 国产精品欧美激情在线观看| 蜜桃视频在线网站| 午夜亚洲视频| 欧美视频自拍偷拍| 91aaaa| seseavlu视频在线| 99精品视频在线| 亚洲国产va精品久久久不卡综合 | 日韩中文字幕亚洲| 熟女熟妇伦久久影院毛片一区二区| 超碰在线caoporen| 久久三级视频| 日韩av影视综合网| 区一区二区三区中文字幕| 你懂的在线视频| 影音先锋中文字幕一区| 欧美性色黄大片手机版| 99久久精品免费看国产四区| yourporn在线观看中文站| 欧美fxxxxxx另类| 欧美人动与zoxxxx乱| 久久久久资源| 四虎av在线| 成人一区在线观看| 91精品国产电影| 欧美日韩激情视频一区二区三区| 亚洲精品欧美| 一本色道久久综合狠狠躁篇怎么玩 | 日韩电影在线看| 亚洲美女久久久| av免费网站观看| 极品美女一区二区三区| 婷婷久久综合九色综合绿巨人| 91在线免费观看网站| 日本小视频在线免费观看| 成人av综合一区| 国产精品揄拍一区二区| 国产美女一区视频| 一区二区三区中文字幕| 久久天堂电影网| 久久偷看各类女兵18女厕嘘嘘| 丝袜+亚洲+另类+欧美+变态| 欧美日韩免费观看一区=区三区| 自拍偷在线精品自拍偷无码专区 | 影音先锋在线影院| 国产精品亚洲天堂| 色妞欧美日韩在线| 久久久久久久高潮| 日本一区二区三区在线不卡| 欧美福利在线观看| 97视频在线观看网站| 夫妻av一区二区| 成人午夜电影在线播放| 色综合久久影院| 欧美精品1区| 最新国产精品拍自在线播放| 羞羞视频网站在线观看| 青草全福视在线| 97久久国产精品| 色欧美激情视频在线| 岛国精品在线观看| 在线国产成人影院| 免费av高清| aa级大片欧美三级| 97香蕉久久超级碰碰高清版| 污视频网站免费看| 国产精品自拍视频在线| 天堂资源在线亚洲| 亚洲国产aⅴ成人精品无吗| 国产精品久久久久久久久久久久冷 | 成人片在线免费看| av一级久久| 一本大道av一区二区在线播放 | 亚洲欧洲中文天堂| 日韩电影在线观看完整版| 91在线观看下载| 黄色网zhan| 狂野欧美一区| 成人在线精品视频| 欧美疯狂性受xxxxx另类| 黄色软件视频在线观看| 亚洲美女屁股眼交3| 2023亚洲男人天堂| 在线观看理论片| 亚洲精选一区| 精品国产伦一区二区三区观看方式| 国产精品免费看一区二区三区| 超碰在线免费播放| 国产成人在线网站| 亚洲午夜av久久乱码| 成年人黄色在线观看| 国产一区二区三区亚洲综合| 国产精品自拍三区| 久久99热这里只有精品国产| 丁香六月婷婷| 校园春色综合网| 久久在线视频在线| 国产av无码专区亚洲精品| 加勒比久久高清| 热久久这里只有精品| 亚洲免费电影在线观看| 亚色视频在线播放| 欧美特黄视频| 亚洲人成网站999久久久综合| 黄色在线视频网站| 精品国产制服丝袜高跟| 大香伊人久久| 日韩在线视频线视频免费网站| 竹内纱里奈兽皇系列在线观看|