国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Transformer危!谷歌MoR架構(gòu)發(fā)布:內(nèi)存減半推理速度還翻倍

人工智能 新聞
Mixture-of-Recursions(MoR),注意不是MoE,它能推理速度提高2倍,而KV內(nèi)存直接減半!

超越Transformer,谷歌推出全新底層架構(gòu)——

Mixture-of-Recursions(MoR),注意不是MoE,它能推理速度提高2倍,而KV內(nèi)存直接減半!

而且All in One,首次在單一框架中實(shí)現(xiàn),用同一組參數(shù)處理不同任務(wù)的同時(shí),進(jìn)行動(dòng)態(tài)分配計(jì)算資源。

就像給LLM開了個(gè)雙層增強(qiáng)buff,模型性能和效率全都要。

圖片

谷歌DeepMind聯(lián)合KAIST AI、Mila人團(tuán)隊(duì)通過統(tǒng)一參數(shù)共享、自適應(yīng)遞歸深度高效KV緩存,在保持大模型性能的同時(shí)降低計(jì)算和內(nèi)存成本,形成新的效率最優(yōu)解。

不少網(wǎng)友甚至將它形容為Transformer Killer

圖片

更有甚者表示,該架構(gòu)的出現(xiàn)或許能代表,潛在空間推理也許將會(huì)成為下一個(gè)LLM突破所在。

圖片

具體MoR創(chuàng)新在哪些方面?下面一一詳解。

MoR:首次統(tǒng)一參數(shù)共享與自適應(yīng)計(jì)算

Transformer的出現(xiàn)雖然帶來了優(yōu)秀的少樣本泛化和推理能力,但隨之而來龐大的計(jì)算和內(nèi)存需求還是讓訓(xùn)練和部署成為難題。

目前相關(guān)優(yōu)化方法主要是參數(shù)共享和自適應(yīng)計(jì)算,但往往只能二選一,無法同時(shí)兼顧。

于是研究人員提出了遞歸混合模型MoR,可以在單一遞歸Transformer中同時(shí)融合兩個(gè)效率維度。

首先采用的遞歸Transformer,相比通過多個(gè)獨(dú)特層構(gòu)建token的標(biāo)準(zhǔn)Transformer,其直接將模型劃分為遞歸塊,復(fù)用一組共享參數(shù)池。

圖片

主要包含三種參數(shù)共享策略:

  1. Cycle:循環(huán)復(fù)用層。
  2. Sequence:連續(xù)復(fù)用同一層。
  3. Middle變體:保留首尾層獨(dú)特參數(shù),僅共享中間層。

利用參數(shù)共享,可以減少獨(dú)特參數(shù)數(shù)量,提升分布式訓(xùn)練效率,并通過連續(xù)深度批處理消除計(jì)算 “氣泡”,提高推理吞吐量。

圖片

然后MoR采用動(dòng)態(tài)路由機(jī)制,通過輕量級(jí)路由器為每個(gè)token分配不同遞歸深度,并集中計(jì)算在復(fù)雜token上,可以分為兩種:

  • Expert-choice路由:將每個(gè)遞歸步驟視作 “專家”,基于隱藏狀態(tài)計(jì)算分?jǐn)?shù),通過閾值選擇合適的token繼續(xù)計(jì)算,采用層級(jí)過濾,優(yōu)先為復(fù)雜token分配計(jì)算。
  • Token-choice路由:初始階段為每個(gè)token分配固定遞歸深度,通過softmax/sigmoid確定專家,然后token按分配深度依次完成遞歸。

圖片

另外,MoR本身還借助KV緩存策略,管理鍵值的存儲(chǔ)與使用,同時(shí)確保內(nèi)存效率的提升:

  • Recursion-wise緩存:僅緩存當(dāng)前遞歸步驟中活躍token的KV對(duì),將注意力計(jì)算限制在本地緩存,降低內(nèi)存和IO需求。
  • Recursive KV共享:復(fù)用首次遞歸的KV對(duì)供后續(xù)步驟使用,確保所有token可訪問歷史上下文,減少預(yù)填充操作,而此時(shí)注意力計(jì)算量下降幅度較小。

在三種策略共同作用下,MoR通過在解碼每個(gè)token時(shí)直接進(jìn)行潛在思考,路由機(jī)制讓模型能進(jìn)行自適應(yīng)推理,突破了先前固定思考深度的限制,實(shí)現(xiàn)了參數(shù)效率與自適應(yīng)計(jì)算的統(tǒng)一。

性能超越Transformer

研究人員在135M到1.7B不同參數(shù)規(guī)模的模型上,就原始Transformer、遞歸基線模型MoR進(jìn)行對(duì)比實(shí)驗(yàn)。

圖片

實(shí)驗(yàn)表明,在相同的16.5e18 FLOPs的訓(xùn)練預(yù)算下,MoR使用了將近50%的更少參數(shù),但實(shí)現(xiàn)了更低的驗(yàn)證損失和更高的平均少樣本準(zhǔn)確率43.1%。

而vanilla模型的少樣本準(zhǔn)確率此時(shí)是42.3%,說明MoR擁有更高的計(jì)算效率,可以在相同F(xiàn)LOPs預(yù)算下處理更多訓(xùn)練token。

在訓(xùn)練固定的20B token時(shí),MoR也減少了25%的訓(xùn)練FLOPs,訓(xùn)練時(shí)間還縮短了19%,峰值內(nèi)存減少25%。

另外,通過分析路由策略,發(fā)現(xiàn)Expert-choice路由的性能會(huì)在一定程度上優(yōu)于Token-choice路由,說明路由粒度會(huì)對(duì)性能產(chǎn)生重要影響。

研究人員還對(duì)MoR進(jìn)行了IsoFLOP分析,發(fā)現(xiàn)在135M、360M、730M和1.7B參數(shù)規(guī)模,以及2e18、5e18、16.5e18的FLOPs預(yù)算下,MoR始終優(yōu)于遞歸基線模型。

圖片

雖然受遞歸容量瓶頸限制,在135M時(shí)略遜于vanilla模型,但在360M及規(guī)模的進(jìn)一步擴(kuò)大,MoR性能接近甚至超過Vanilla模型,且參數(shù)僅為后者的1/3,驗(yàn)證了MoR的可擴(kuò)展性。

推理吞吐量評(píng)估上,360M規(guī)模的MoR模型在固定批大小和最大批大小設(shè)置下,均優(yōu)于vanilla。

圖片

遞歸深度的增加讓更多token提前退出,KV緩存占用減少,吞吐量顯著提升,驗(yàn)證了深度批處理與早期退出結(jié)合對(duì)部署效率的提升。

谷歌對(duì)底層架構(gòu)的再思考

這已經(jīng)不是谷歌第一次對(duì)底層架構(gòu)進(jìn)行重新思考,甚至可以說,谷歌始終希望利用架構(gòu)創(chuàng)新重構(gòu)計(jì)算范式,重新尋找AI新的平衡。

例如混合專家模型(MoE)正是這一理念的集中體現(xiàn)。

最早是在2017年,谷歌首次將MoE引入LSTM層,通過稀疏門控機(jī)制,僅激活部分專家網(wǎng)絡(luò)從事輸入處理,但仍能讓參數(shù)量高達(dá)137B的模型保持高效訓(xùn)練。

圖片

后面推出的GShard將MoE與Transformer結(jié)合,可實(shí)現(xiàn)動(dòng)態(tài)負(fù)載均衡,2021年的Switch Transformer又進(jìn)一步地簡(jiǎn)化了路由機(jī)制。

Gemini 1.5 Pro就是采用的分層MoE架構(gòu),將專家網(wǎng)絡(luò)與多模態(tài)處理深度結(jié)合,可以處理更為復(fù)雜的多模態(tài)任務(wù),訓(xùn)練和服務(wù)效率也得到顯著提升。

圖片

MoE的底層邏輯設(shè)計(jì)突破了傳統(tǒng)全連接模型的計(jì)算缺陷,現(xiàn)在已經(jīng)成為了許多超大規(guī)模模型的優(yōu)先選擇,為應(yīng)對(duì)算力瓶頸提供了新范式。

另外還有像TokenFormer等可擴(kuò)展架構(gòu),將模型參數(shù)視為可學(xué)習(xí)的token,通過增量訓(xùn)練無縫擴(kuò)展模型規(guī)模,為未來千億級(jí)模型的低成本迭代提供了可能。

所以有網(wǎng)友認(rèn)為,關(guān)于谷歌如今推出的MoR,會(huì)在未來徹底改變AI世界規(guī)則,會(huì)超越Transformer嗎?一切交給時(shí)間驗(yàn)證。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-07-17 13:05:35

2023-07-18 14:19:00

模型AI

2025-03-14 11:56:52

2009-03-18 09:06:00

GoogleChrome瀏覽器

2022-06-20 14:36:49

TensorFlow機(jī)器學(xué)習(xí)

2024-03-04 13:23:34

數(shù)據(jù)模型

2021-12-31 09:34:22

PyTorchtransformer模型

2023-01-08 13:22:03

模型

2025-01-26 13:20:49

谷歌AI模型Titans

2023-12-05 13:25:00

數(shù)據(jù)訓(xùn)練

2025-04-21 09:07:00

2024-01-26 10:09:01

2021-09-30 11:14:17

谷歌框架技術(shù)

2024-04-07 07:46:00

谷歌架構(gòu)

2019-12-23 08:57:50

Python代碼單線程

2023-03-22 13:53:26

芯片英偉達(dá)

2025-12-09 01:30:00

LLM谷歌斯坦福

2024-07-26 09:29:38

2025-03-19 09:38:58

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲一区二区视频| 天天做天天爱天天爽综合网| 一个人免费观看视频www在线播放 一个人免费视频www在线观看 | 国产精品国产精品国产专区蜜臀ah | 欧美中文字幕一区二区三区| 久久久久久久久久久黄色| 西西人体一区二区| 国产极品在线观看| 91麻豆福利| 男人的天堂视频在线| 亚洲资源在线看| 97国产精品视频人人做人人爱| 亚洲精品之草原avav久久| 在线观看视频一区二区| 亚洲视频一区在线观看| 日本一区二区久久| 成人永久看片免费视频天堂| 欧美三级第一页| 欧美码中文字幕在线| 亚洲欧美校园春色| 深爱激情久久| 欧美www视频在线观看| 国产a亚洲精品| 欧美成人黑人| 免费人成在线观看播放视频| 精品一二三区视频| 偷拍25位美女撒尿视频在线观看| 高清日韩av| 午夜成人影视| 免费裸体视频网站| 日韩在线视频在线| 国产肉体ⅹxxx137大胆| 久久综合婷婷综合| 久久免费在线观看| 2019中文在线观看| 日韩免费黄色av| 欧美成人四级hd版| 欧美高清无遮挡| 97国产在线视频| 91传媒免费看| 日本一区二区三区四区高清视频| 成人免费视频网址| 亚洲精品高清视频| 日本国产在线播放| 中文字幕第36页| 欧美大片aaa| 中文在线8资源库| 久久久国产91| 日韩美女主播视频| 91沈先生在线观看| 成年人视频大全| 国产理论在线播放| www.亚洲天堂网| 免费av片风间由美在线| 91亚洲天堂| 亚洲综合在线电影| 第一会所sis001亚洲| 亚洲欧美亚洲| 国产999精品久久久久久绿帽| 亚洲国产综合在线| 欧美一级在线视频| 欧美一级视频免费在线观看| 久久久久久国产精品mv| 91在线视频观看免费| 亚洲色图16p| 成人全视频在线观看在线播放高清| 成人免费av| 97国产精品videossex| 国产精品不卡在线观看| 欧美一区二区三区四区视频| 久久人人爽人人爽人人片av高请| 91在线无精精品一区二区| 国产高清av在线播放| 日本ー区在线视频| 日韩pacopacomama| 伊人久久大香线蕉综合网蜜芽| 久久精品麻豆| 色婷婷国产精品| 青青草99啪国产免费| 欧洲精品国产| 女同互忝互慰dv毛片观看| 精品视频成人| 国产伦精品一区二区三区免费| 一区二区三区国产豹纹内裤在线 | 日本一区二区在线不卡| 欧美亚一区二区| 久久99久久99精品中文字幕| 免费看av软件| 2020国产在线| 99久久影视| 久久亚洲综合色一区二区三区| 日韩精品最新网址| 91成人免费视频| 1pon在线| 国产欧美日韩视频在线| 久久亚洲综合av| 不卡伊人av在线播放| 亚洲激情一区二区三区| 色网站在线看| 国产欧美大片| 在线免费观看日韩欧美| 久久综合免费视频| 无码人妻丰满熟妇区毛片| 全球最大av网站久久| 国产精品久久久久久久久妇女| 国产99久久久精品| 一夜七次郎国产精品亚洲| 中文字幕中文字幕在线中一区高清| 免费观看在线黄色网| 欧美资源在线| 欧美日韩aaa| 国产97免费视| 日韩欧美精品一区二区三区经典| 日本www在线播放| 女人天堂在线| 日本精品久久| 在线电影一区二区| 欧美精品久久天天躁| 亚洲最大色综合成人av| 免费网站免费进入在线| 老妇喷水一区二区三区| 北条麻妃在线一区二区| 亚洲精品日韩精品| 色天使综合视频| 亚洲一区二区五区| 国语精品免费视频| 亚洲精品mv| 一二三区精品视频| 精品国产乱码久久久久久郑州公司| 国产精品久久麻豆| 国产麻豆精品视频| 97香蕉久久夜色精品国产| 麻豆网站在线免费观看| 久久婷婷国产综合精品青草| 色婷婷av一区二区三区久久| www.成人精品免费网站青椒| 极品尤物久久久av免费看| 亚洲国产精品人久久电影| www.精品在线| 国产一区二区三区久久久久久久久| 在线这里只有精品| 欧美日韩一区二区视频在线| 91亚洲精品| 精品动漫一区二区| 日本a在线天堂| 天天做夜夜做人人爱精品| 精品国免费一区二区三区| av在线天天| 国产亚洲在线| 北条麻妃在线一区二区| 亚洲s色大片| 2024国产精品视频| 亚洲视频sss| **女人18毛片一区二区| 日韩不卡中文字幕| 欧美高清成人| 一区二区在线观看视频 | www.天天射.com| 国产精一区二区三区| 91精品国产精品| 国产盗摄一区二区| 在线免费观看一区| 欧美知名女优| 最新中文字幕一区二区三区| a级国产乱理论片在线观看99| 国产剧情一区二区在线观看| 色综合天天做天天爱| 成年人在线播放| 国产日本欧洲亚洲| 亚洲国产一二三精品无码 | 一本色道久久综合亚洲精品小说| 蜜芽tv福利在线视频| 亚洲福利一区二区三区| 秋霞在线观看av| 国产精品―色哟哟| 99爱免费视频| 亚洲欧美福利一区二区| 2022亚洲天堂| 国产精品一国产精品k频道56| 91精品视频在线看| 国产精品视屏| 欧美精品做受xxx性少妇| 综合毛片免费视频| 亚洲高清av在线| 肉色欧美久久久久久久免费看| 亚洲老头老太hd| 成人教育av| 久久久av一区| 精品视频一区二区三区在线观看| 欧美一区二区三区男人的天堂| 麻豆av在线免费观看| 日韩免费电影网站| 欧洲午夜精品| 欧美专区第一页| 综合久久十次| 久久亚洲一区二区| 国产精品538一区二区在线| 成人精品视频一区二区| 亚洲夂夂婷婷色拍ww47 | 黄色影院在线播放|