国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

為什么這篇谷歌論文被稱為「Attention is all you need」V2

人工智能 新聞
繼著名的“Attention Is All You Need”之后,谷歌新論文再度引爆圈內(nèi):我們可能忽略了AI的“另一半大腦”。

從小老師就愛說“好記性不如爛筆頭”,那么我們?yōu)槭裁床唤o有“記憶缺陷”的大模型配一個(gè)小本本記上總結(jié)歸納的要點(diǎn)呢?

繼著名的“Attention Is All You Need”之后,谷歌新論文再度引爆圈內(nèi):我們可能忽略了AI的“另一半大腦”。

這篇文章題為嵌套學(xué)習(xí):深度學(xué)習(xí)架構(gòu)的幻象(Nested Learning: The Illusion of Deep Learning Architectures)在圈內(nèi)被譽(yù)為是“Attention is all you need”V2

失憶的巨人

你是否曾對(duì)AI感到一絲“恨鐵不成鋼”?你剛剛在對(duì)話中詳細(xì)解釋過一個(gè)概念,三句話之后它就可能完全遺忘,仿佛從未發(fā)生。ChatGPT們上知天文下知地理,卻學(xué)不會(huì)你今天剛教它的一件小事。

這并非偶然的Bug,而是當(dāng)前所有大型語言模型(LLMs)共同的“先天疾病”——數(shù)字失憶癥

為了“治療”它,過去十年,整個(gè)行業(yè)幾乎只遵循一條黃金定律:把模型做得更深、更大。我們不斷堆疊Transformer層,追逐萬億參數(shù),相信“規(guī)模即智能”,期待著記憶相關(guān)的能力也能“涌現(xiàn)”出來。

但是,這個(gè)努力方向有著明顯的問題:僅提高算法復(fù)雜度可能并不會(huì)使能力顯著提升

具體而言,深度模型的計(jì)算深度可能不會(huì)隨著層數(shù)的增加而改變,模型的擴(kuò)大對(duì)某些參數(shù)的容量提升影響十分有限,快速適應(yīng)新任務(wù)、持續(xù)學(xué)習(xí)以及泛化性也很難通過參數(shù)量堆疊“自發(fā)涌現(xiàn)”。另外,受限于優(yōu)化器,訓(xùn)練過程可能收斂到一個(gè)次優(yōu)解。

近日,谷歌一項(xiàng)顛覆性的研究指出,我們可能忽略了一個(gè)與“深度”同等重要、甚至更為根本的維度

這項(xiàng)名為“嵌套學(xué)習(xí)”的研究,正以燎原之勢(shì)在學(xué)術(shù)圈內(nèi)引發(fā)地震。許多資深研究者將其私下稱為“Attention is All You Need” V2。它沒有提出新的炫酷模塊,而是試圖回答了那個(gè)最根本的問題:機(jī)器學(xué)習(xí)的本質(zhì),究竟是什么?

優(yōu)化器竟是記憶體

一切顛覆性的認(rèn)知,往往始于對(duì)常識(shí)的重新審視。研究團(tuán)隊(duì)選擇了一個(gè)最基礎(chǔ)、最不被注意的起點(diǎn):優(yōu)化器

無論是經(jīng)典的隨機(jī)梯度下降,還是如今廣泛使用的Adam,我們都將其視為訓(xùn)練模型的“引擎”或“導(dǎo)航儀”——它計(jì)算梯度,指引參數(shù)朝損失下降的方向前進(jìn),僅此而已。

然而,這篇論文給出了一個(gè)反直覺的證明:主流的優(yōu)化器本身,就是一個(gè)持續(xù)進(jìn)行著“記憶”的關(guān)聯(lián)記憶系統(tǒng)

這是什么意思?想象一下,優(yōu)化器不僅在看當(dāng)前的路況(即時(shí)梯度),它內(nèi)部還有一個(gè)默默做筆記的黑盒子。這個(gè)盒子不斷壓縮、存儲(chǔ)一路走來所有梯度變化的“模式”與歷史。當(dāng)我們以為自己在做“訓(xùn)練模型”這一件事時(shí),實(shí)際上已經(jīng)不知不覺地運(yùn)行了多個(gè)嵌套的、在不同時(shí)間尺度上并行的小型學(xué)習(xí)程序

這個(gè)發(fā)現(xiàn),成為了撬動(dòng)整個(gè)新范式的支點(diǎn)。它意味著,從最底層的優(yōu)化器,到中層的注意力機(jī)制,再到整個(gè)神經(jīng)網(wǎng)絡(luò),都可以被統(tǒng)一地重新審視——它們不再是功能各異被拼湊起來的零件,而是在不同速度、不同抽象層級(jí)上,嵌套運(yùn)行的“學(xué)習(xí)-記憶”模塊

我們熟悉的、引以為傲的“深度學(xué)習(xí)”體系,從這個(gè)全新的視角看,僅僅是這個(gè)更宏大、更立體范式的一個(gè)扁平化投影

缺失的維度

基于這一核心洞察,論文提出了一個(gè)簡潔而深刻的新范式:嵌套學(xué)習(xí)。它認(rèn)為,真正有效的智能學(xué)習(xí)需要兩個(gè)正交的維度:

1. 深度:即模型的層數(shù)與容量,這是我們過去十年全力拓展的。

2. 頻率:即模型內(nèi)部組件自我更新的節(jié)奏與速度,這是我們先前幾乎完全忽略的。

人工智能的進(jìn)步常受到人腦的啟發(fā),這次也不例外。

人類之所以能持續(xù)學(xué)習(xí)、終身成長,是因?yàn)榇竽X同時(shí)用多種“生物時(shí)鐘”在工作。有些神經(jīng)元回路快速反應(yīng),處理瞬息萬變的感官信息(如正在進(jìn)行對(duì)話);有些則緩慢而堅(jiān)定地鞏固,將重要模式沉淀為長期知識(shí)或技能。這是一個(gè)連續(xù)、平滑的時(shí)間頻譜,信息在不同頻率的“通道”間有序流動(dòng)、加工和儲(chǔ)存。

而當(dāng)前的大模型就像得了“順行性失憶癥”,這種病的患者在病癥發(fā)作后無法形成新的長期記憶,但此前的既有記憶則保持完好。這種狀況將患者的知識(shí)與體驗(yàn)局限在兩個(gè)時(shí)間片段:一個(gè)是很久遠(yuǎn)的過去(發(fā)病之前),另一個(gè)是極其短暫的現(xiàn)在。患者會(huì)不斷地經(jīng)歷每一個(gè)“當(dāng)下”,仿佛它們永遠(yuǎn)是嶄新的、無法被記住的。

這與當(dāng)前的大模型情況相似,只有兩種極端的工作頻率:一種是快速響應(yīng)但轉(zhuǎn)瞬即逝的對(duì)話緩存,另一種是在預(yù)訓(xùn)練完成后便凍結(jié)的長期知識(shí)。它嚴(yán)重缺失了中間所有頻譜的“記憶通道”。因此,任何新知識(shí)都無處安放,要么在對(duì)話結(jié)束后遺忘,要么覆蓋舊記憶為代價(jià)以高昂的計(jì)算成本更新——這正是“數(shù)字失憶癥”的根源。

HOPE與連續(xù)記憶光譜

全新的理論,需要全新的架構(gòu)來證明。基于“嵌套學(xué)習(xí)”范式,研究團(tuán)隊(duì)構(gòu)建了名為HOPE的新型架構(gòu)。其核心創(chuàng)新是一個(gè)連續(xù)記憶系統(tǒng)

這不再是一兩個(gè)孤立的記憶模塊,而是一系列像光譜一樣排列的MLP模塊。每個(gè)模塊都以預(yù)設(shè)的、不同的頻率進(jìn)行更新。信息輸入后,會(huì)在這些不同節(jié)奏的記憶模塊間自動(dòng)流動(dòng)與分配:

高頻模塊像“工作記憶”,快速捕捉對(duì)話中的即時(shí)細(xì)節(jié)與上下文。

中頻模塊像“近期記憶”,負(fù)責(zé)提煉和歸納一段時(shí)間內(nèi)出現(xiàn)的模式。

低頻模塊像“長期記憶”,緩慢而穩(wěn)定地將最重要的知識(shí)沉淀為模型固有能力。

這個(gè)過程,高度模仿了神經(jīng)科學(xué)中信息從海馬體向新皮層轉(zhuǎn)移、鞏固的經(jīng)典機(jī)制。在初步實(shí)驗(yàn)中,HOPE已經(jīng)在標(biāo)準(zhǔn)語言建模和常識(shí)推理任務(wù)上展現(xiàn)了強(qiáng)大的競爭力。

更重要的是,它顯露出了解決持續(xù)學(xué)習(xí)問題的巨大潛力——新知識(shí)可以在這條“記憶光譜”上找到自己合適的位置,被漸進(jìn)式地消化吸收,而非引發(fā)系統(tǒng)性的崩潰或遺忘。

一場靜待發(fā)生的范式轉(zhuǎn)移

“嵌套學(xué)習(xí)”的價(jià)值,或許不在于明天就取代Transformer,成為大模型的主流骨架。它的深遠(yuǎn)意義在于,提供了一套全新的設(shè)計(jì)邏輯和思考框架

它的成功啟示我們,下一代AI的突破,不一定依賴于發(fā)明更復(fù)雜的“神經(jīng)元積木”,而在于為AI設(shè)計(jì)一套能激發(fā)潛能的框架。這正是其被譽(yù)為“V2”的原因——如同2017年“注意力”機(jī)制統(tǒng)一了序列建模的視野,“嵌套學(xué)習(xí)”正試圖為學(xué)習(xí)過程本身,構(gòu)建一個(gè)統(tǒng)一、可解釋的“白箱”模型。

當(dāng)然,這仍是非常前沿的探索,這場關(guān)于“記憶”與“學(xué)習(xí)”本質(zhì)的重新思考,才剛剛拉開序幕。人工智能的未來,或許不僅需要更深的網(wǎng)絡(luò),更需要一個(gè)能夠?qū)W習(xí)和演化的系統(tǒng),而不僅僅是作為一個(gè)靜止的、被凝固在訓(xùn)練完成那一刻的“知識(shí)琥珀”。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-08-03 13:25:04

AI模型

2024-02-01 08:32:03

Nginx服務(wù)器代理

2022-01-01 19:00:17

LinuxLinux命令文件夾

2025-03-24 13:24:23

2025-06-13 15:59:48

AI谷歌論文

2025-06-13 14:27:05

AI模型智能體

2024-06-20 10:52:27

2022-04-27 09:33:01

EasyNLP開源框架

2022-06-30 18:05:51

訓(xùn)練模型圖像

2021-02-22 17:36:39

700MHz黃金頻段移動(dòng)通信

2023-12-17 13:07:11

訓(xùn)練數(shù)據(jù)

2025-09-15 08:49:44

GoJSONAPI

2022-12-14 08:58:48

谷歌Chrome瀏覽器

2010-08-05 17:00:04

RIP V2協(xié)議

2010-08-06 14:07:21

RIP V2

2023-06-20 08:01:09

RoseDB存儲(chǔ)數(shù)據(jù)

2024-10-14 14:10:00

大模型AI開源

2024-10-08 13:38:56

2012-04-11 16:39:41

英特爾IDF超級(jí)本

2025-04-22 09:30:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩欧美国产骚| 91在线三级| 天堂√在线中文官网在线| 黄色在线网站噜噜噜| 免费成人网www| 国产色综合网| 日本一区二区三区国色天香 | a在线视频观看| 国产精品v日韩精品v在线观看| 国产精品久久久久77777丨| av中文一区| 国产自产2019最新不卡| 91精品国产免费久久综合| 欧美成人中文字幕| 先锋资源久久| 91亚洲精华国产精华| 国产精品美乳一区二区免费 | 97超碰人人模人人爽人人看| 免费亚洲视频| 蜜臀av性久久久久av蜜臀妖精| 99精品在线观看视频| 黄色日韩网站视频| av在线不卡免费看| 高清成人在线观看| 欧美日韩第一区| 热久久久久久久| 成人av中文字幕| 亚洲图片欧美激情| 在线观看日韩精品| 国产亚洲精品一区二555| 97国产在线观看| 99久久99久久精品国产片| 国产精品无码乱伦| 永久免费在线| 亚洲电影有码| 极品日韩av| 亚洲色图在线视频| 亚洲精品国精品久久99热| 91在线免费观看网站| 国产日韩一区欧美| 无码粉嫩虎白一线天在线观看| 亚洲少妇久久久| 自拍在线观看| 三级在线观看视频| 男人最爱成人网| 国产欧美一区| 国产欧美日本一区二区三区| 国产精品永久入口久久久| 视频一区二区欧美| 日韩免费视频| 色婷婷久久久| 亚洲成人黄色| 日韩五码电影| 欧美激情伊人电影| 久久影院理伦片| 伊人网站在线| 一区二区在线视频观看| 日韩二区在线观看| 国产精品电影一区二区三区| 精品国产免费人成在线观看| 全亚洲最色的网站在线观看| 日本大胆人体视频| 91禁在线看| 毛片一区二区| 欧美日本在线播放| 国产一区再线| 欧美一区二区三区在线观看免费| 日韩欧美三级| 亚洲成人免费av| 国产91精品久| 国产精品涩涩涩视频网站| 欧美亚洲大陆| 免费在线亚洲欧美| 亚洲综合在线观看视频| 超碰97国产在线| av毛片在线看| 在线一区二区三区视频| 色小子综合网| 精品久久久在线观看| 成人国产精品久久久| 亚洲热app| 亚洲巨乳在线| 亚洲男女av一区二区| 天天综合日日夜夜精品| 李宗瑞系列合集久久| 蜜桃传媒视频麻豆第一区免费观看 | 中文字幕av一区| 精品国产乱码久久久久久久软件| 欧美精品一区二区三区涩爱蜜| 天堂99x99es久久精品免费| 亚洲欧美日韩国产中文在线| 国产91在线播放| 日韩av中文| 国产一区不卡视频| 麻豆国产精品va在线观看不卡| 国产天堂在线播放| 理论片一区二区在线| 亚洲h在线观看| 欧美一区二视频在线免费观看| 成人影音在线| 久久久一区二区三区捆绑**| 久久综合免费视频| 男人添女人下部高潮视频在观看| 日本激情一区| 亚洲最大中文字幕| 成年人观看网站| 污污片在线免费视频| 国产精品免费观看| 蜜臀久久99精品久久久久宅男| 欧美成人剧情片在线观看| 国产毛片一区二区三区| 亚洲精品欧美极品| 国产高清自拍99| 亚洲国产欧美不卡在线观看| 国产毛片久久久久久国产毛片| 99热在线这里只有精品| 在线观看的毛片| 欧美日韩中文在线观看| 日韩不卡av| 精品淫伦v久久水蜜桃| 欧洲精品视频在线观看| 国产一二三四五| 久久综合另类图片小说| 欧美三级三级三级爽爽爽| 日本在线视频www色| 日韩综合在线| 久久亚洲国产精品| 麻豆福利在线观看| 婷婷开心久久网| 亚洲精品一二三四五区| 蜜臀av性久久久久蜜臀av麻豆| 国产精品久久久久久久app| 国产第一亚洲| 欧美一区二区三区视频| 人人超碰在线| 亚洲免费观看视频| 97成人在线观看视频| 国产精品探花在线观看| 色久优优欧美色久优优| 国产l精品国产亚洲区久久| 美女视频黄久久| 91中文字精品一区二区| 手机av免费在线| 成人黄色网址在线观看| 久久久精品国产一区二区三区| 国产亚洲一区二区三区啪| 久久综合色影院| 国产在线日韩在线| 成人在线分类| 精品无人区太爽高潮在线播放 | 日本中文字幕片| 视频一区欧美日韩| 91在线视频免费| 欧美3p在线观看| 亚洲bt欧美bt日本bt| heyzo久久| 国产精品久久国产精品99gif| 国产+成+人+亚洲欧洲在线| 久久精品国产久精国产思思| 久久免费影院| 久久深夜福利免费观看| 日韩电影免费观看高清完整版| 日韩精品在线观看一区| а√在线中文网新版地址在线| 欧美男男青年gay1069videost| 天堂91在线| 亚洲精品日韩专区silk| 国产男女在线观看| 国产精品1区2区| 麻豆一区二区三区在线观看| 激情五月色综合国产精品| 欧美成人精品1314www| 日本电影免费看| 国产一区高清在线| 99re6在线| 日韩伦理一区二区三区| 日韩精品资源二区在线| 妺妺窝人体色www在线小说| 欧美亚洲一级| 秋霞av国产精品一区| 国产精品白丝久久av网站| 4438x亚洲最大成人网| 成人网18免费网站在线| 成人午夜激情影院| 天天操天天摸天天爽| 五月天久久比比资源色| 国产成人l区| 国产成人8x视频一区二区| 97在线观看免费| 日韩视频精品在线观看| 在线视频1区2区| 黄色一区二区在线| 亚洲国产精品小视频| 91啪国产在线| 在线观看欧美视频| 免费h精品视频在线播放| 色播在线观看| 日韩欧美中文在线观看| 精品影院一区二区久久久| 欧美视频一区在线观看|