国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

52頁PPT,谷歌Gemini預訓練負責人首次揭秘!擴展定律最優解

人工智能 新聞
大模型之戰烽火正酣,谷歌Gemini 2.5 Pro卻強勢逆襲!Gemini Flash預訓練負責人親自揭秘,深挖Gemini預訓練的關鍵技術,看谷歌如何在模型大小、算力、數據和推理成本間找到最優解。

谷歌憑借Gemini 2.5 Pro在激烈的大模型競爭中一舉翻盤。

近日,Geimini Flash預訓練負責人Vlad Feinberg在普林斯頓大學分享了相關內容。

他深入分析了Gemini預訓練的方法、挑戰以及方向,如何在模型大小、算力、數據和推理成本間取得平衡。

圖片

PPT鏈接:https://vladfeinberg.com/assets/2025-04-24-princeton-talk.pdf

經典擴展定律

模型訓練中,計算資源的合理利用至關重要。

假設有計算資源(C)1000塊H100芯片,運行30天,如何訓練出最佳的LLM呢?

這就涉及到模型參數量(N)和訓練token數量(D)。

對于Transformer,計算量C和N、D之間存在一個近似公式:C≈6×N×D。

圖片

MLP是模型的重要組成部分,不同操作的浮點運算量和參數量有所不同。

比如圖片這個操作,訓練時的浮點運算量是6BTDF,參數量為DF。

把MLP的多個操作加起來,總訓練浮點運算量約為18BTDF,參數數量達到3DF。

注意力機制的計算更為復雜。將注意力機制相關操作的計算量相加,約為12BTSNH=12BT2NH,參數量為4DNH。

將MLP和注意力機制的計算量合并,就能了解整個模型訓練時的計算量情況。

Kaplan定律

2020年,Kaplan等人的研究揭示了模型性能與數據量、模型規模和計算量之間的關系。

自回歸Transformer模型中,小模型可以用來預測大模型的性能。

模型性能與算力、參數量、數據量之間存在冪律關系。當計算預算增加10倍時,模型參數量應增加5.37倍,數據量增加1.86倍。

這一結論在當時引起了廣泛關注,點燃了企業的「軍備競賽」。

圖片

Chinchilla(龍貓)

然而,2022年,DeepMind對Kaplan的觀點提出了質疑。

圖片

Kaplan的研究在每個模型規模下僅運行一次訓練,并用中間損失來估計不同token訓練步數下的損失。

Chinchilla論文指出,基于單次訓練的中間loss點來推斷存在缺陷,通過適當的學習率衰減可以獲得更好的損失值,只有最終的損失值才是最優的。

論文采用IsoFlops方法,固定浮點運算量預算,同時改變模型規模和訓練token數量。

  • 固定總算力C
  • 訓練多個不同參數N的模型,對應不同數據量D(C≈6×N×D)
  • 找到loss最低的模型N_opt(C)和D_opt(C)
  • 重復以上步驟,得到不同算力下的最優(N,D)點,并擬合

圖片

研究發現,模型參數N和數據量D應以大致相同的速率(冪律指數約為0.5)隨算力C增長,這與Kaplan等的結論大相徑庭。

這意味著,按Kaplan定律訓練的模型,可能存在訓練不足的情況,數據太少,會增加模型后續部署和使用的成本。

圖片

為了進一步優化模型訓練,研究人員嘗試了多種方法。通過不同的計算場景和擬合方式,得到了更精確的系數。

混合專家(MoE)模型的擴展定律展現出了獨特的優勢。與傳統模型相比,在相同的活躍參數數量和固定100B token的情況下,MoE 64E模型的性能更優。

圖片

然而,MoE模型對token數據的需求量較大,互聯網上的可用數據逐漸難以滿足其需求,這成為了發展瓶頸。

為了解決數據不足的問題,研究人員將目光投向了更多的數據來源。多模態數據,如音頻、視覺、3D 模型、視頻等,為模型訓練提供了豐富的信息。

合成數據也受到了關注。實際應用中,需要在生成質量與篩選成本之間找到平衡。

實時場景的模型選擇

在谷歌的許多應用場景中,如免費的Gemini聊天機器人、AIO、AIM、Vertex AI(用于模型微調、部署)以及AI Studio(提供生成式API)等,推理效率至關重要。

這些應用需要快速給出準確的響應,對模型的推理速度和效率要求極高。

就拿實時應用來說,Astra和Mariner都需要快速響應。

以一個網絡交互智能體為例,假設上下文128k,但每次增量只有8k token,解碼需要128 token來生成一個動作,并且動作之間的延遲不超過1秒,其中250毫秒還得用于框架搭建、負載均衡等操作。

用Llama3-70B模型和v5e芯片做實驗,發現單芯片處理8k token需5.7秒。為了達到0.5秒的API延遲限制,需要搭建4×4 v5e并行。

實時應用中,小模型反而更有優勢,如Gemini Flash/Flash-lite。

圖片

Chinchilla的擴展方法雖然在模型訓練的計算優化上有效,但它忽略了推理成本。

在實際應用中,需要綜合考慮訓練和推理的成本,找到更合適的模型和數據配置。

推理優化擴展定律

《超越Chinchilla最優:在語言模型擴展定律中考慮推理因素》這篇論文提出了新的推理優化Scaling Laws。

核心思想是,不僅最小化訓練loss,而是要綜合考慮訓練和推理的總計算量,為模型優化提供了新的方向。

圖片

按照這些公式,在相同計算量下,與Chinchilla最優策略相比,應該訓練更小的模型,并使用更多的數據,因為推理所需的計算量更少。

當然,這也存在新的挑戰。

  • 計算資源的非同質性:實際應用中計算資源存在差異,用于推理優化的芯片各不相同,給推理優化帶來了困難。
  • 推理量D_inf難以預測:技術進步提高資源利用效率,反而會增加對該資源的需求(杰文斯悖論)。模型質量提升可能會擴大市場,進而影響推理時的token數量D_inf。
  • 擬合效果不佳:不同數據集下,相關參數的擬合效果存在差異。不同token與參數比例的數據子集,擬合得到的 α、β等參數不同,和Chinchilla的擬合結果也有較大差異。

針對這些問題,研究人員采用在數據約束下建模的方法。研究引入新維度,即有意區分數據,提出新的損失函數和數據規模公式,這樣訓練出來的模型更小,對數據重復的魯棒性更強。

圖片

對于推理token數量的處理,像Llama3模型,有研究指出其8B和70B參數的模型,在訓練到15T token后,性能仍呈對數線性提升,即D_inf可視為無窮大。

蒸餾的探索與應用

除了模型大小、數據量和推理成本,知識蒸餾為推理優化擴展帶來了新的思路。

知識蒸餾擴展定律公式:

圖片

通過調整這些參數,可以優化學生模型的性能。

不過,知識蒸餾在實際應用中也有一些問題,比如趨勢影響不明顯、部分情況考慮不周全等,但可以通過權重調整等方法進行改進。

從原理上講,知識蒸餾能降低方差,更好的教師模型能減少偏差,為模型優化提供了新途徑。

谷歌Gemini預訓練技術對經典擴展定律和推理優化擴展定律都進行了深入研究。

經典擴展定律通過探索模型規模、數據量和計算量之間的關系,不斷優化模型訓練的資源配置。

推理優化擴展定律針對推理成本和效率問題,綜合考慮訓練和推理需求,提出新方法,提升模型整體性能。

同時,知識蒸餾等技術的應用也為模型的優化提供了更多的途徑。

Vlad Feinberg

圖片

Vlad Feinberg畢業于普林斯頓大學計算機科學專業,于加州大學伯克利分校RISE實驗室攻讀博士學位。

后來,Feinberg加入了一家名為Sisu的初創公司,擔任機器學習主管。他曾任職于谷歌研究院的Cerebra項目,目前在谷歌DeepMind工作。

責任編輯:張燕妮 來源: 新智元
相關推薦

2014-05-21 16:04:38

面試面試規則

2021-10-13 18:59:42

AI

2025-11-05 09:08:46

2012-03-11 15:35:53

Android

2024-01-31 13:42:05

模型訓練

2012-05-22 22:00:07

谷歌

2012-09-26 13:44:52

Android谷歌阿里云

2025-07-04 08:43:00

2011-08-23 17:02:37

FedoraLinux 20周年

2012-12-13 11:12:24

戴爾

2017-03-13 15:30:22

慕尼黑WindowsLiMux

2014-06-27 14:49:41

SDN

2016-01-15 10:47:08

技術團隊能力

2011-08-23 18:07:42

QomoLinux 20周年

2023-09-11 11:14:54

IT團隊CIO

2009-09-15 10:45:52

Linux驅動Linux微軟

2015-11-16 10:16:56

技術蛻變創業

2009-07-16 08:19:46

魔獸網易

2025-11-19 15:25:30

2024-04-03 13:05:20

數據訓練
點贊
收藏

51CTO技術棧公眾號

国产激情在线观看视频| 国产视频一区二区三区四区| 亚洲欧美变态国产另类| 亚洲欧美中文另类| 国产精品精品国产| 大陆成人av片| 亚欧在线免费观看| 夜夜精品视频一区二区| 日产精品久久久久久久性色| 99久久综合狠狠综合久久| 色播五月综合网| 久久久久久穴| 久久艳片www.17c.com| 狠狠久久综合| 亚洲精品电影在线观看| 成人在线视频首页| 国产精品12345| 欧美激情中文字幕| 91在线观看| 在线视频一区二区三区| 国产成人午夜精品| 一级中文字幕一区二区| 久久久久久蜜桃一区二区| 亚洲人午夜精品天堂一二香蕉| 日本免费一区二区三区| 久久精品免费看| 国产精品wwwww| 波波电影院一区二区三区| 国产成人久久777777| 亚洲免费观看高清完整| 在线观看特色大片免费视频| 国产精品久久久久久久久久久久久久| 一区二区av在线| 91|九色|视频| 噜噜爱69成人精品| 欧美国产日韩激情| 亚洲综合视频在线观看| 国产裸舞福利在线视频合集| 日韩精品在线电影| 妖精一区二区三区精品视频 | 国产精品久久久久久五月尺 | 91原创国产| 韩日欧美一区二区三区| 日本xxxx黄色| 在线观看视频欧美| 唐人社导航福利精品| 欧美激情第99页| 99精品小视频| 在线观看欧美一区| 亚洲国产精品久久久久秋霞影院| 日本三级一区| 国产精品欧美激情| 国产成人在线影院| 亚洲成人影院在线观看| 欧美精品一区二区精品网| 国产成人福利av| 亚洲视频在线观看日本a| 亚洲精品视频自拍| а√天堂8资源在线| 国产精品久久久久99| 国产一区二区三区综合| 国产专区视频| 亚洲精品国产品国语在线| 亚洲图片久久| 极品粉嫩国产18尤物| 色综合久久综合网| 另类一区二区| 亚洲欧美中文日韩在线| 9l视频自拍九色9l视频成人| 中国一级大黄大黄大色毛片| 亚洲电影在线播放| 国产一区二区三区视频在线| 亚洲精品一区二区三区樱花| 亚洲精品久久久久久久久久久| 国产欧美二区| 在线观看av片| 国产精品尤物福利片在线观看| 国产日本欧洲亚洲| 国产视频一区二| 九一免费在线观看| 精品播放一区二区| 日韩黄色免费网站| 狂野欧美激情性xxxx欧美| 日韩一区不卡| 欧美成人精精品一区二区频| 日韩高清一级片| 狠狠综合久久av一区二区小说| eeuss一区二区三区| 国产精品入口麻豆九色| 超碰精品在线观看| 91av成人在线| 久久久久久久久99精品| 亚洲精品一级二级三级| 国产在线三区| 久久av二区| 亚洲人成在线观| 国产欧美一区二区在线观看| 久久精品av| 丁香花在线影院| 777久久久精品一区二区三区| 国产精品免费一区豆花| 色婷婷av一区二区三区之一色屋| 亚洲久久在线| 性感女国产在线| 免费看涩涩视频| 成人动漫在线视频| 亚洲欧美另类国产| 国产精品久久久久久久久动漫| 国一区二区在线观看| 浪潮色综合久久天堂| 捆绑紧缚一区二区三区在线观看| 国产传媒一区| 国产亚洲精品一区二555| 九色|91porny| 你懂得影院夜精品a| 欧美18 19xxx| 精品一区2区三区| 在线精品视频视频中文字幕| 亚洲码国产岛国毛片在线| 91在线一区| 青青久在线视频| 亚洲国产精品女人| 国产精品视频网| 北条麻妃国产九九九精品小说 | 交换国产精品视频一区| 久久精品久久久久久国产 免费| 国产欧美日韩麻豆91| 一区二区中文| 美女色狠狠久久| 色就是色亚洲色图| 69堂免费视频| 综合色婷婷一区二区亚洲欧美国产| 日韩视频免费观看高清完整版 | 日韩中文字幕一区| 91精品国产高清自在线| 亚洲成人精品久久| 黄色精品在线看| 久久综合色天天久久综合图片| 麻豆精品视频在线| 亚洲精品一区av在线播放| 精品一区二区三区中文字幕视频| 国产高清一区日本| 91丨九色丨国产在线| 亚洲精品国产suv| 图片区小说区区亚洲影院| 久久久久亚洲蜜桃| 免费在线看成人av| 综合久久亚洲| 露出调教综合另类| 日韩一区二区三区免费| 日韩毛片久久久| 成r视频免费观看在线播放| 久久久噜噜噜www成人网| 亚洲精品无人区| 国产精品一区在线观看| 欧美大成色www永久网站婷| 欧美日韩中国免费专区在线看| 欧美在线91| 亚洲精品伊人| 亚洲丝袜精品| 日韩欧美亚洲系列| 亚州福利视频| 欧美一级淫片aaaaaaa视频| 黑人精品xxx一区一二区| 国产精品一区二区无线| 欧美猛男做受videos| 综合日韩av| 精品一区2区三区| 在线观看中文字幕亚洲| 91久久精品一区二区三| 国产欧美视频一区二区| 久久精品国产999大香线蕉| 国产精品久久久久久久久久10秀 | 国产成人免费视| 国一区二区在线观看| 久9re热视频这里只有精品| 欧美91看片特黄aaaa| 日本激情视频在线观看| 在线成人动漫| 国产一级大片| 四虎永久在线精品无码视频| 久久久国产精华液999999| 国产精品区一区| 成人国产精品免费视频| 992tv成人免费影院| 伊人久久综合97精品| 日韩福利视频在线观看| 91精品国产综合久久精品麻豆| 欧美日韩久久久久| 国产精品嫩草99a| 不卡电影一区二区三区| 国产麻豆视频一区| 蜜桃精品视频在线观看| 久久精品亚洲| 亚洲每日更新| 99精品热6080yy久久| 日韩电影一区| 久久要要av| 日韩激情图片| 国产韩日影视精品|