国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

小米大模型提效新框架:訓練最高提速34%,推理最高提速52%!Kaldi之父合作出品

人工智能 新聞
與LLaMA模型相比,SUBLLM在訓練和推理方面分別實現了26%和37%的速度提升,同時顯著降低了內存成本,同時保持了性能。

大模型推理速度提升50%以上,還能保證少樣本學習性能!

小米大模型團隊提出SUBLLM(Subsampling-Upsampling-Bypass Large Language Model),國際AI語音大牛、開源語音識別工具Kaldi之父Daniel Povey也參與指導。

與Llama等模型相比,SUBLLM在訓練和推理速度以及降低內存方面都有了顯著提升。

在大模型訓練中,SUBLLM的速度提高了26%,每個GPU的內存減少了10GB。在推理中,它的速度提高了37%,每個GPU的內存減少了1GB。

訓練和推理速度分別最高可以提高至34%和52%。

圖片

SUBLLM通過智能地選擇和處理數據,使得模型在訓練和推理時更加高效:子采樣模塊剔除不必要的信息,上采樣模塊恢復數據的完整性,而繞過模塊則加快了學習過程。

圖片

在一萬字中挑選最關鍵的五百字

目前,云端的大模型處理超長文本任務,通常需要動用多達8個GPU,這個過程不僅耗時,而且成本昂貴。如果將大模型類比于人腦,那么當前大模型的運行功率相比于人腦運行功率的100倍以上。

此前,Daniel Povey在語音識別領域提出了Zipformer,Zipformer可以用最低壓縮16倍的幀率,達到與更大模型一致甚至更高的語音識別率,完成了語音識別領域的“四兩撥千斤”。

小米集團大模型團隊嘗試將這一思路擴展至大型語言模型中,在性能不受損害的前提下,實現了更高效率的大模型運算。

總的來說,SUBLLM的工作原理通過引入子采樣、上采樣和旁路模塊等方式,對計算資源動態分配,從而減少了冗余的token計算負擔,加速了模型的訓練和推理過程。

能做到就像在一萬字中挑選最關鍵的五百字一樣,保留文本中必需的部分,刪減其中的冗余,從而讓大模型所需處理的文本更短。

就實現路徑而言,會將子采樣模塊根據token的重要性分數對其進行篩選,保留重要的token并丟棄不重要的部分。

隨后,上采樣模塊將子采樣后的序列恢復到原始長度,確保語言模型在生成token時的順序一致性。

同時,旁路模塊通過結合子采樣前后的序列,進一步提高了模型的收斂速度。這種設計不僅顯著減少了計算成本,還保持了輸入序列的語義完整性。

如果將SUBLLM理解為一個聰明的編輯,就像我們的大腦會識別要點一樣,它可以在閱讀一大段文字時快速識別出哪些詞是關鍵的,哪些詞不那么重要。SUBLLM會保留那些重要的詞匯,而忽略那些不太重要的部分,這就大大減少了需要處理的信息量。

隨后,就像我們能通過只言片語補充完整故事的來龍去脈,SUBLLM也能將精簡后的信息恢復到原有的完整度,確保整個文本在表達時的連貫與完整。在處理信息時,SUBLLM還能更加迅速地找到最佳的表達方式。

接下來具體看SUBLLM的模型結構。

SUBLLM具體長啥樣?

前不久,谷歌Deepmind提出了mixture of depths(MoD)模型結構,MoD使用靜態計算預算,使用每個塊的路由器選擇token進行計算,并通過對自注意力和MLP塊或殘差連接的選擇來優化FLOP使用。

更早以前,經典論文CoLT5使用條件路由來決定給定token是通過輕量分支還是重量分支在前饋和注意力層中傳遞,以便將更多資源分配給重要token。

與這些模型結構類似,SUBLLM采用的原理接近于人腦對于信息的處理機制。

人腦有兩種思維模式,一種低功耗的快模式,一種高功耗的慢模式,分工明確,且兩種模式恰恰用的是同一個腦部區域。

因此,SUBLLM作者也從這一信息處理模式的角度思考了如何將大模型的算力進行合理地分配:重要的token用全部算力,相對不重要的token使用更少算力。

具體來說,SUBLLM的模型結構是基于decoder-only的大語言模型架構,在不改變原有模型結構的基礎上,在一些特殊的層上進行了結構升級。

圖片

為了管理要處理的token數量,子采樣和上采樣模塊被集成到Transformer塊之間。

首先,模型使用幾個Transformer塊處理完整序列,捕獲全面的token序列表示。

引入子采樣模塊后,這些模塊暫時去除不關鍵的token,從而減少處理所需的序列長度。

然后對縮減后的序列進行更多次的子采樣過程,也就是序列的縮減是嵌套的。序列壓縮的最高級別發生在網絡的最中間的Transformer塊中。

隨后,使用上采樣模塊逐步恢復序列長度。這些模塊將較短的處理序列與子采樣前的原始序列合并,將它們恢復到完整長度。

這種機制允許僅解碼器模型作為語言模型操作,按順序生成token,保證輸入和輸出序列長度相同。

此外,上采樣過程后集成了繞過連接模塊,以利用每個子采樣前的嵌入,幫助改進從子采樣到上采樣的學習過程。

隨后的實驗證實,這種方法顯著提高了收斂效率。

與LLaMA模型相比,SUBLLM在訓練和推理方面分別實現了26%和37%的速度提升,同時顯著降低了內存成本,同時保持了性能。

預訓練階段、推理階段計算效率的詳細分析:

圖片

論文鏈接:https://arxiv.org/abs/2406.06571

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-06-05 10:11:02

寬帶提速寬帶

2020-05-14 14:21:50

谷歌AI數據

2024-08-08 17:48:56

2025-10-29 09:05:04

2022-03-21 17:56:59

大模型訓練訓練框架

2022-03-21 15:06:10

模型字節跳動框架

2025-04-30 16:48:07

2023-12-11 15:40:32

PyTorch代碼大模型

2021-09-06 14:57:24

AI 數據人工智能

2025-07-08 09:05:00

2025-06-05 08:40:00

2021-03-07 12:00:43

微軟Edge瀏覽器

2024-11-02 10:28:03

2023-04-03 14:25:01

Python編譯

2024-01-03 15:50:33

Python循環測試

2023-10-11 12:32:53

AI模型

2022-07-13 16:09:19

模型AI訓練

2023-05-30 14:17:00

模型推理

2023-02-17 10:32:20

點贊
收藏

51CTO技術棧公眾號

国产精品久久波多野结衣| 黄色影视在线观看| 91精品国产乱| 国产免费一区二区三区在线能观看| 精灵使的剑舞无删减版在线观看| 国产精品久久久久桃色tv| 亚洲国产一二三精品无码| 99国产成+人+综合+亚洲欧美| 日本精品免费观看| fc2在线中文字幕| 日韩一区二区在线观看视频播放| 中文字幕精品一区二区三区精品| 久久久久国产精品一区| 亚洲综合日韩欧美| 黄色网页在线免费观看| 日韩三级电影网| 美女精品一区二区| 99久热re在线精品996热视频 | 亚洲一级黄色片| 国产经品一区二区| 高清国语自产拍免费一区二区三区| 亚洲第一图区| 亚洲高清视频在线| 天堂中文字幕| 欧美亚洲动漫制服丝袜| 牛牛精品在线视频| 亚洲国产精品久久久天堂 | 精品欧美一区二区久久久伦| 国产一区二区91| 九色成人在线| va亚洲va日韩不卡在线观看| 中文字幕久久综合| 久久久综合九色合综国产精品| 国产视频三区| 日韩成人中文电影| 精品无人区麻豆乱码久久久| 日韩欧美视频一区二区三区四区| 久久久青草青青国产亚洲免观| 日本免费在线视频| 9.1国产丝袜在线观看| 模特精品在线| 天天看片激情网站| 俺去亚洲欧洲欧美日韩| 亚洲免费网址| 毛片一级免费一级| 91精品啪在线观看国产爱臀| 91桃色在线| 欧美高清一级大片| 日韩精品一级中文字幕精品视频免费观看 | 欧美挠脚心网站| 91av精品| 草草草视频在线观看| 玉足女爽爽91| www.成人影院| 久久精品aaaaaa毛片| 国产精品成人一区二区艾草| 91福利区在线观看| 97碰碰视频| 亚洲素人一区二区| 忘忧草在线www成人影院| 国产乱码精品一区二区三区不卡| 国产午夜精品一区二区三区视频| 国产色婷婷在线| 91综合免费在线| 国产一区二区三区免费播放 | 蜜桃视频在线网站| 国产精品亚洲视频在线观看| 成人综合激情网| 免费一级在线观看| 深夜福利91大全| 日本不卡在线视频| 猫咪av永久| 久久人人爽亚洲精品天堂| 黑丝一区二区三区| 九七影院理论片| 亚洲天堂av网| 欧美+亚洲+精品+三区| 九九99九九精彩| 色悠悠国产精品| 久久99国产精品免费| 国产小视频在线观看| 成人国产在线视频| 一区二区三区欧美激情| 尤物网在线观看| 日韩av在线免费看| 国产美女视频91| 日韩电影在线观看完整免费观看| 欧美日韩福利视频| 色婷婷综合激情| 久久久亚洲精品一区二区三区| 午夜精品剧场| 天天做夜夜做人人爱精品| 男女免费观看在线爽爽爽视频| 男女午夜网站| 99热在线这里只有精品| 精品一区二区不卡| 亚洲bt欧美bt日本bt| 欧美成人自拍视频| 日韩欧美国产一二三区| 亚洲成a人片77777在线播放| 国产不卡123| 在线观看中文字幕| 午夜久久久精品| 激情五月宗合网| 国产成人艳妇aa视频在线 | 日韩视频一二区| 国产盗摄精品一区二区酒店| 在线播放色视频| 亚洲国产日韩欧美在线观看| 欧美国产综合在线| www.黄色网址.com| 综合久久国产| 中文字幕成人一区| 日韩三级在线播放| 日韩亚洲视频在线| 亚洲欧洲一二三| 日韩成人av电影在线| 亚洲 日韩 国产第一区| 亚洲aa中文字幕| 中文字幕亚洲欧美一区二区三区| 日韩视频免费观看高清完整版| 欧美日韩性视频| 欧美色播在线播放| 亚洲男人的天堂在线观看| 国产激情一区二区三区四区| 韩日精品视频| 欧美日韩亚洲一区三区| 日韩亚洲精品在线| 视频一区二区三区在线| 国产精品一区二区三区网站| 日本欧美一区二区| 国产美女在线精品| 久久精品欧美日韩| 中文字幕中文字幕一区| 中文字幕在线播放不卡一区| 亚洲美女免费视频| 欧美影院一区二区三区| 欧美videos中文字幕| 国产综合自拍| 国产精品福利在线观看播放| 成年人视频在线观看免费| 牛牛热在线视频| 91caoporn在线| 日本网站免费在线观看| 精品人妻大屁股白浆无码| 131美女爱做视频| 中文字幕亚洲乱码| 天堂网在线免费观看| 在线观看av片| 国模一区二区| 国产精品嫩模av在线| 五月天久久久| 不卡的av电影在线观看| 欧美伊人精品成人久久综合97| 亚洲欧美国产精品专区久久| 91久久精品美女高潮| 婷婷五月综合缴情在线视频| 亚洲精选av在线| 男的插女的下面视频| 欧美一区二区福利在线| 日韩成人中文字幕在线观看| 欧美极品欧美精品欧美视频 | 日本一区福利在线| 亚洲综合欧美| 一区二区视频在线| 国产一区二区三区在线免费观看| 国产在线观看91精品一区| 国产人妻777人伦精品hd| av男人的天堂在线| 深夜福利久久| 久久精品视频免费| 亚洲最新av在线网站| 精品国产一区二区三区麻豆免费观看完整版 | 日韩女优视频免费观看| 国产精品免费久久久久影院| 欧美日本视频在线| 1024亚洲合集| 夫妻av一区二区| 欧美精品一区二区三区在线播放| 亚洲最大福利视频| 成人黄色影视| 亚洲免费成人av在线| 亚洲视频免费观看| 久久福利视频导航| 国产h视频在线播放| 后进极品白嫩翘臀在线播放| 国产盗摄女厕一区二区三区 | 日韩天堂av| 日韩欧美色综合网站| 蜜桃传媒视频第一区入口在线看| 麻豆影视在线观看_| 午夜亚洲视频| 日韩精品亚洲视频| 国产精品专区在线| 91综合久久爱com| 国产精品久久久久影视| 国产日韩欧美视频在线| 乱人伦中文视频在线| 久久精品国产一区二区| 亚洲国产精品人久久电影|