国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

新聞 人工智能
來自微軟、加州大學默塞德分校的研究者提出了一種名為「 ZeRO-Offload 」的異構深度學習訓練技術,可以在單個 GPU 上訓練擁有 130 億參數的深度學習模型,讓普通研究者也能著手大模型的訓練。

  現在的模型動輒數百、數千億參數,普通人訓不動怎么辦?

前不久,谷歌發布了參數量為 1.6 萬億的語言模型Swith Transformer,將 GPT-3 創下的參數量記錄(1750 億)推至新高。這些大模型的出現讓普通研究者越發絕望:沒有「鈔能力」、沒有一大堆 GPU 就做不了 AI 研究了嗎?

在此背景下,部分研究者開始思考:如何讓這些大模型的訓練變得更加接地氣?也就是說,怎么用更少的卡訓練更大的模型?

為了解決這個問題,來自微軟、加州大學默塞德分校的研究者提出了一種名為「 ZeRO-Offload 」的異構深度學習訓練技術,可以在單個 GPU 上訓練擁有 130 億參數的深度學習模型,讓普通研究者也能著手大模型的訓練。與 Pytorch 等流行框架相比,ZeRO-Offload 將可訓練的模型規模提升了 10 倍,而且不需要數據科學家對模型做出任何改變,也不會犧牲計算效率。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

論文鏈接:https://arxiv.org/pdf/2101.06840.pdf

ZeRO-Offload 通過將數據和計算卸載(offload)至 CPU 來實現大規模模型訓練。為了不降低計算效率,它被設計為最小化與 GPU 之間的數據往來,并在盡可能節省 GPU 內存的同時降低 CPU 的計算時間。因此,對于一個參數量為 100 億的模型,ZeRO-Offload 可以在單個 NVIDIA V100 GPU 上實現 40 TFlops/GPU。相比之下,使用 PyTorch 訓練一個參數量為 14 億的模型僅能達到 30TFlops,這是在不耗盡內存的情況下所能訓練的最大模型。ZeRO-Offload 還可以擴展至多 GPU 設置并實現線性加速,最多可在 128 個 GPU 上實現近似線性加速。

此外,ZeRO-Offload 還可以和模型并行一起使用,在一個 DGX-2 box AI 服務器上訓練參數量超 700 億的模型。與單獨使用模型并行相比,這一參數量實現了 4.5 倍的規模提升。

在下文中,我們將結合 Medium 博主 LORENZ KUHN 的一篇博客來詳細了解這篇論文。

ZeRO-Offload 是什么?

ZeRO-Offload 是一種通過將數據和計算從 GPU 卸載到 CPU,以此減少神經網絡訓練期間 GPU 內存占用的方法,該方法提供了更高的訓練吞吐量,并避免了移動數據和在 CPU 上執行計算導致的減速問題。

借助 ZeRO-offload,使用相同的硬件能訓練以往 10 倍大的模型,即使在單個 GPU 上也是如此。比如在一個 32GB RAM 的 V100 GPU 上訓練百億參數的 GPT-2。

此外,ZeRO-offload 還能實現在多 GPU 設置中的近似線性擴展。

對于研究者來說,ZeRO-offload 適用的情況包括:

想訓練更大的模型,或者想更快地訓練現在的模型,因為 ZeRO-offload 允許訓練更大的 batch size;

你正在使用 PyTorch,并且愿意 / 能夠使用微軟的 DeepSpeed 庫(ZeRO-offload 的其他實現形式暫未推出),你也可以嘗試根據官方實現自行調整;

愿意接受一些建模時的限制,比如當前版本的 ZeRO-Offload 需要搭配使用 Adam 的混合精度訓練。

如何使用?

ZeRO-Offload 在微軟的 DeepSpeed 庫中實現,官方實現地址:https://github.com/microsoft/DeepSpeed/blob/6e65c2cc084ecfc393c67a2f64639e8d08d325f6/deepspeed/runtime/zero/stage2.py。

在 DeepSpeed 中設置完畢后,使用 ZeRO-Offload 就不需要太多額外的工作了,只需要修改一些標志和配置文件。

目前,Hugging Face 的 transformers 庫與 DeepSpeed 進行了實驗性集成,使用方法和基準測試結果參見:https://huggingface.co/blog/zero-deepspeed-fairscale。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

Facebook 研究院的 fairscale 有 ZeRO 的部分實現,ZeRO-Offload 正是基于 ZeRO 這一多 GPU 內存優化方法構建的。目前還不支持 CPU 卸載。

ZeRO-Offload 的工作原理

ZeRO-Offload 是基于 Zero Redundancy Optimizer (ZeRO) 構建的。ZeRO 是微軟在 2020 年 2 月提出的一種萬億級模型參數訓練方法,用于數據并行和模型并行訓練中的內存優化,其中梯度、參數和優化器狀態分布在多 GPU 內存中,沒有任何冗余。這使得 GPU 之間的通信開銷保持在比較低的狀態。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

與標準數據并行基準相比,ZeRO 在三個階段中節省的內存和通信用量。

讓我們來回顧一下 ZeRO:

為了解決數據并行和模型并行存在的問題,ZeRO 提供了三階段的優化方法,分別為優化器狀態分割、梯度分割、參數分割,三個階段按順序實施。

在優化器分割狀態:ZeRO 降低了 3/4 的內存,通信量和數據并行相同;

加入梯度分割:降低了 7/8 的內存,通信量和數據并行相同;

加入參數分割:內存減少與數據并行度呈線性關系。例如,在 64 個 GPU 上進行分割的時候,可以將內存降至 1/64。在通信量上有 50% 的提升。

在去年 9 月份的博客中,微軟這么介紹 ZeRO-Offload:

ZeRO-Offload 繼承了 ZeRO-2 的優化器狀態和梯度分割。但與 ZeRO-2 不同的是,ZeRO-Offload 不在每塊 GPU 上保持優化器狀態和梯度的分割,而是將二者卸載至主機 CPU 內存。在整個訓練階段,優化器狀態都保存在 CPU 內存中;而梯度則在反向傳播過程中在 GPU 上利用 reduce-scatter 進行計算和求均值,然后每個數據并行線程將屬于其分割的梯度平均值卸載到 CPU 內存中(參見下圖 g offload),將其余的拋棄。一旦梯度到達 CPU,則每個數據并行線程直接在 CPU 上并行更新優化器狀態分割(參見下圖 p update)。

之后,將參數分割移回 GPU,再在 GPU 上執行 all-gather 操作,收集所有更新后的參數(參見下圖 g swap)。ZeRO-Offload 還利用單獨的 CUDA 流來窮盡通信與計算中的重疊,從而最大化訓練效率。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

ZeRO-Offload 概覽。

值得注意的是,ZeRO-Offload 專為使用 Adam 的混合精度訓練而設計。也就是說,當前版本的 ZeRO-Offload 使用 Adam 的優化版本 DeepCPUAdam。其主要原因是避免 CPU 計算成為整個過程中的瓶頸。DeepCPUAdam 的速度是 Adam PyTorch 實現的 6 倍。

實驗結果

最后來看一下 ZeRO-Offload 論文中提供的一些實驗結果。

下圖 7 展示了利用 ZeRO-Offload 技術在 1 個、4 個或 16 個 GPU(一個 DGX-2)上可以訓練的最大模型情況。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

下圖 11 展示了每個 GPU 的吞吐量隨 GPU 數量增加而呈現的變化情況。可以看出,在 GPU 數量逐漸增加至 128 個的過程中,ZeRO-Offload 幾乎可以實現吞吐量的線性加速。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

下圖 8 展示了使用 PyTorch、L2L 和 ZeRO-Offload 實現的每個 GPU 吞吐量差異。從中可以看出,利用 ZeRO-Offload 實現的每個 GPU 吞吐量比 L2L 平均高出 14%(最多高出 22%)。

訓練一個130億參數的模型要用幾個GPU?微軟:一個就夠

 

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2024-07-29 12:47:32

2013-03-14 10:14:17

微軟云計算公有云

2013-07-12 10:18:39

微軟CEO鮑爾默微軟

2023-02-25 16:14:36

AIMeta語言模型

2025-10-24 10:41:33

2023-04-07 09:28:31

模型訓練

2020-09-11 10:48:49

微軟機器學習開源AI

2023-09-26 16:44:14

光模塊

2013-10-09 10:04:20

LinuxGit

2016-09-26 17:26:20

2021-09-29 15:49:37

Exchange開源用戶開發者

2024-02-19 00:21:45

開源圖片

2023-04-12 16:16:53

微軟開源

2020-06-10 14:30:45

代碼開發AI

2021-08-04 17:55:38

keysRedis數據庫

2023-01-03 12:30:25

架構CPUGPU

2014-10-14 15:50:19

UIAndroid

2018-11-01 13:23:02

網關APIHTTP

2016-03-01 14:37:47

華為

2022-04-06 09:47:55

AI谷歌人工智能
點贊
收藏

51CTO技術棧公眾號

国产成人亚洲欧美| 神马午夜dy888| 欧美日韩国产在线观看网站| 亚洲色图日韩av| 免费a在线看| 欧美日韩中文字幕在线视频| 成色在线视频| 亚洲啪啪综合av一区二区三区| 精品无码国产一区二区三区av| 久久综合图片| 久久www免费人成精品| 外国成人激情视频| 国产一区视频在线播放| 欧美日韩在线二区| 国产精品欧美激情| 欧美wwwww| 亚洲va久久久噜噜噜久久天堂| 欧美肉体xxxx裸体137大胆| 国产盗摄xxxx视频xxx69| 久久99视频| 国产精品一区二区久久久久| 成人午夜av| 国产在线视频不卡| 午夜精品999| 精品国产一区二区三区日日嗨| 激情欧美日韩| 美女被啪啪一区二区| 丝袜亚洲另类欧美| 亚洲欧美日韩在线综合| 国产精品一区二区三区网站| 男女超爽视频免费播放| 中文字幕av一区二区三区高| 69免费视频| 巨茎人妖videos另类| 日韩精品一区二区三区视频在线观看 | 欧美成va人片在线观看| 午夜羞羞小视频在线观看| 欧美日韩在线播| 日本一本在线免费福利| 国产视频久久久久久久| 欧美成人毛片| 欧洲精品在线视频| 欧美国产高清| 青春草在线视频免费观看| 久久久www免费人成精品| 亚洲jjzzjjzz在线观看| 色老综合老女人久久久| 亚洲资源一区| 欧美精品在线免费观看| 精品一区电影| 视频一区二区三| 91一区二区三区在线观看| 国产网站av| 69久久夜色精品国产69蝌蚪网| 卡通欧美亚洲| 欧美在线性爱视频| 久久成人一区| 欧美三级一级片| 亚洲成人资源在线| 国产三线在线| 久久久久久久久电影| 综合天堂久久久久久久| 国产 国语对白 露脸| 一区二区三区波多野结衣在线观看| 婷婷五月在线视频| 毛片精品免费在线观看| 亚洲女同一区| 大伊香蕉精品视频在线| 欧美日韩国产中文字幕| 日本在线影院| 国产精品入口免费视频一| 另类专区欧美蜜桃臀第一页| 免费看黄视频网站| 欧美精品一区二区三区在线| 国产精品毛片久久久| 免费99视频| 国产精品国产三级国产aⅴ入口 | 自拍偷拍在线视频| 精品欧美乱码久久久久久| 成人搞黄视频| 欧美一区二区福利| 国产精品乱码一区二区三区软件| 精品久久久久一区二区三区 | 欧美日韩在线精品一区二区三区激情综 | 亚洲三级电影网站| 91精品国产91久久久久久青草| 久久中文字幕在线视频| 国产精品地址| 成人免费淫片在线费观看| 欧美三级电影精品| 国产一区福利| 真实国产乱子伦对白视频| 欧美综合色免费| 精品国产一区二区三区性色av| 九色综合婷婷综合| 日韩美女视频一区| 二吊插入一穴一区二区| 国产精品久久精品国产| 最新欧美精品一区二区三区| 91欧美精品| 伊人久久大香线蕉午夜av| 在线免费观看日韩欧美| 国产一区二区精品福利地址| 男人靠女人免费视频网站 | 男人的天堂在线视频| 欧美激情综合亚洲一二区| 麻豆国产精品官网| 国产三级在线观看| 国产精品久久久久久av下载红粉| thepron国产精品| 四虎亚洲精品| 精品一区久久久| 欧美日韩亚洲国产一区| 精品在线99| 在线成人私人影院| 久久久精品中文字幕| 激情久久五月天| 18av在线视频| 欧美一区二区视频17c| 欧美日韩亚洲高清一区二区| 91精品国产乱码久久久久久| 最全影音av资源中文字幕在线| 欧美诱惑福利视频| 国产精品福利av| 丁香婷婷成人| 天天操天天爱天天爽| 久热精品视频在线观看一区| 岛国av在线一区| 欧美日韩电影免费看| 国产女人18毛片| 亚洲精品成人久久久| 久久机这里只有精品| 男男gaygays亚洲| 欧美凹凸一区二区三区视频| 在线不卡欧美精品一区二区三区| 好看的亚洲午夜视频在线| 婷婷国产在线| 亚洲综合在线小说| 日本道在线观看一区二区| 综合久久十次| 91国语精品自产拍在线观看性色| 国产成人精品亚洲日本在线桃色 | 国产盗摄视频在线观看| 亚洲国产精品中文| 国产成人av电影在线| 国产成人免费精品| 亚洲精品无码久久久久久| 久久99精品国产99久久6尤物| 久久久亚洲国产美女国产盗摄 | 日韩中文字幕在线视频| 久久品道一品道久久精品| 久久动漫网址| 亚洲天堂第二页| 亚洲一区二区在线免费观看视频| 欧美精品啪啪| 亚洲国产一区二区精品专区| av在线电影观看| 欧美成人综合一区| 亚洲精品一区二区三区在线观看| 麻豆一区区三区四区产品精品蜜桃| 国产日产久久高清欧美一区| 欧美巨大另类极品videosbest | 亚洲一区二区三区免费看| 精品不卡在线视频| eeuss影院一区二区三区| 偷拍视屏一区| 一二三四社区在线视频| 国产在线一区二| 精品亚洲一区二区三区| 国产三级三级三级精品8ⅰ区| 国产一区二区三区站长工具| 日本激情在线观看| 久久精品无码中文字幕| 国产精品高潮在线| 精品国产自在久精品国产| 久久久久九九视频| 日韩欧美高清| a级片在线免费观看| 三级在线视频观看| 国产乱码精品一区二区三区不卡| 亚洲美女www午夜| 亚洲高清不卡在线观看| 毛片av一区二区三区| 免费欧美激情| 午夜激情电影在线播放| 伊人精彩视频| 亚洲精品国产suv一区88| 国产欧美日韩中文字幕在线| 日韩毛片在线看| 五月婷婷欧美视频| 国产一区二区三区久久久| 视频国产一区| 黄视频网站在线观看| 欧美vide| 日本午夜激情视频| 久久久久网址| 日本一区二区在线免费播放| 日韩精品在线看| 午夜成人在线视频| 91网站最新网址|