国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

解密萬億參數M6模型預訓練背后的分布式框架Whale

開發 開發工具 分布式
M6是國內首個實現商業化落地的多模態大模型。M6擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、制造業、文學藝術等諸多領域擁有廣泛應用前景。

[[418050]]

最近,阿里云PAI團隊和達摩院智能計算實驗室一起發布“低碳版”巨模型M6,大幅降低萬億參數超大模型訓練能耗。借助我們自研的Whale框架僅使用480卡GPU,即訓練出了規模達人類神經元10倍的萬億參數多模態大模型M6,與傳統海外公司實現萬億參數規模相比,能耗降低超八成、效率提升近11倍。

M6是國內首個實現商業化落地的多模態大模型。M6擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、制造業、文學藝術等諸多領域擁有廣泛應用前景。

這里來為大家介紹支持萬億參數模型訓練的Whale框架設計。

一、模型發展趨勢和挑戰

1.模型發展趨勢

隨著深度學習的火爆,模型的參數規模也增長迅速,OpenAI數據顯示:

  • 2012年以前,模型計算耗時每2年增長一倍,和摩爾定律保持一致;
  • 2012年后,模型計算耗時每3.4個月翻一倍,遠超硬件發展速度。

近一年模型參數規模飛速增長,谷歌、英偉達、阿里、智源研究院都發布了萬億參數模型,有大廠也發布了百億、千億參數模型。同時,隨著模型參數規模增大,模型效果也在逐步提高,Nvidia測試Bert模型不同參數規模,發現模型困惑度隨模型參數規模增加而降低。

Google在GShard paper中也發現MoETransformer 模型參數規模越大,翻譯質量越高。

2.大模型訓練的挑戰

大模型帶來模型效果提升的同時,也為訓練框架帶來更大的挑戰,例如當我們要訓練一個萬億規模的模型時會面臨如下挑戰:

  • 訓練難:
    • GPU顯存已經不夠存放模型副本,數據并行已經不能滿足需求;
    • 需要框架提供新的并行策略,協同多GPU能力來存放和訓練模型;
    • 如何給用戶提供簡潔、易用的接口,讓用戶能很容易實現分布式版模型;
    • 超大規模模型對計算效率、通信效率都帶來很大挑戰,如何提高計算和通信效率;
    • 下游任務如何對接,如何支持批量預測和在線推理需求;
  • 成本高:
    • 以萬億模型為例,模型參數有4TB大小、梯度也有4TB,加上optimizer states和active tensor,顯存需求巨大;
    • 業界訓練同等規模模型需要的資源:英偉達 3072 A100、谷歌 2048 TPU v3,成本太高很難落地;
    • 如何降本增效,使用更少的資源,更快的訓練收斂;

當前已經有一些分布式訓練框架,例如:Horovod、Tensorflow Estimator、PyTorch DDP等支持數據并行,Gpipe、PipeDream、PipeMare等支持流水并行,Mesh Tensorflow、FlexFlow、OneFlow、MindSpore等支持算子拆分,但這些框架還有一些不足:

  • 模式單一:很多框架只支持部分并行策略,不能完全支持各種混合并行;
  • 接入門檻高:用戶實現模型分布式版本難度大、成本高,需要有領域專家經驗才能實現高效的分布式并行策略;
  • 遷移代價大:不同分布式框架并行化實現割裂,不同框架有各自定義的DSL,當用戶要切換并行策略時,需要學習各種接口,重新改寫模型;
  • 性能不理想:部分框架實現未考慮集群物理環境;

為了應對當前分布式訓練的挑戰,我們研發了分布式訓練框架Whale,主要目標是:

  • 統一多種并行策略:在一個框架中支持各種并行策略以及這些策略的各種組合;
  • 簡潔易用的接口:用戶只需添加幾行annotation即可完成并行策略的配置,模型代碼不需要改動;
  • 高效的訓練框架:結合硬件資源、網絡拓撲和模型進行協同優化,打造高效分布式訓練框架;

二、PAI自研Whale框架

1.Whale架構

我們推出統一多種并行策略的高性能分布式訓練框架Whale,從如下角度來應對分布式訓練的挑戰:

  • 將不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略;
  • 基于Tensorflow設計一套分布式并行接口,完全兼容Tensorflow,用戶僅僅只需添加幾行annotation就可以實現豐富的分布式并行策略;
  • 結合模型結構和網絡拓撲進行調度和通信優化,提供高效的分布式訓練能力。

Whale框架如下圖所示,主要分4個模塊:

  • API:提供簡潔易用接口,讓用戶組合使用各種混合并行策略;
  • Whale IR:將并行策略轉成內部表達,通過TaskGraph、Multi-Dimension、VirtualDevices抽象來表達各種并行策略;
  • Whale Engine:基于WhaleIR,通過圖編輯工具來構建分布式執行圖;
  • Runtime:將分布式執行圖轉成TFGraph,再調用TF 的Runtime來執行;

2.Whale簡介易用接口

Whale提供簡潔易用的接口來描述各種并行策略,主要的原語:

  • cluster:配置Virtual Device的劃分方法
  • replica:數據并行
  • stage:劃分TaskGraph
  • pipeline:流水并行
  • split:算子拆分

用這些接口可以組合各種并行策略,例如:

  • 數據并行:

  • 流水并行:

流水并行+數據并行:

更多并行策略示例:

3.Whale訓練流程

使用Whale進行分布式訓練流程:

  • 并行策略配置:
    • 使用Whale API來為模型配置并行策略,只需添加幾行annotation,無需修改模型代碼,方法如 2.2節 所示;
    • 可以將模型劃分為多個TaskGraph,TaskGraph支持配置多個并行策略,每個TaskGraph可以配置不同的并行策略;
  • 虛擬資源劃分:
    • 按并行策略來劃分Virtual Device,每個TaskGraph對應一個Virtual Device;
    • 按GPU資源和網絡topo來為Virtual Device選擇Physical Device;
  • 分布式執行圖:
    • 基于并行策略和資源分配信息,使用圖編輯工具來編輯執行圖(圖拷貝、拆分、插入通信節點等),生成最終的分布式執行圖;
    • 調用TF的runtime來執行分布式Graph;

三、萬億M6模型預訓練

萬億模型的算力需求非常大,為了降低算力需求,Whale中實現了MoE(Mixture-of-Experts)結構,MoE的主要特點是稀疏激活,使用Gating(Router)來為輸入選擇Top k的expert進行計算(k常用取值1、2),從而大大減少算力需求。

Whale中實現了MoE(Mixture-of-Experts) layer,并支持專家并行,將experts拆分到多個Devices上,降低單個Device的顯存和算力需求。同時數據并行有利于提升訓練的并發度,因此采用數據并行+專家并行組合的混合并行策略來訓練M6模型:MoElayer采用專家并行,其他layer采用數據并行。

Whale中提供簡潔易用的接口來進行模型的混合并行訓練,只需要增加幾行annotation來配置并行策略,模型本身不需要任何修改。M6模型采用數據并行+專家并行的策略,只需要增加如下圖的annotation:

同時為了節約訓練資源,提高訓練效率,Whale中提供各種優化技術:

顯存優化:

  • Auto Gradient Checkpoint,自動選擇最優checkpoint節點,節約activation的顯存;
  • Group-wise Apply,優化Optimizer Apply階段的顯存;
  • CPU Offload技術,優化Optimizer status和Weight的顯存;
  • 通信池化,控制通信的數據塊大小和并發,節約通信的顯存;

計算、通信加速:

  • 采用DP+EP混合并行策略,降低算力需求;
  • 采用分組融合通信、半精度通信、拓撲感知的All2All通信算子等技術來提高通信效率;
  • 結合混合精度、編譯優化等技術提高訓練效率;
  • 借助Whale框架,首次在480 V100 上,3天內完成萬億M6模型的預訓練。相比此前英偉達使用3072 A100 GPU實現萬億參數、谷歌使用2048 TPU實現1.6萬億參數大模型,此次達摩院僅使用480卡V100 32G GPU就實現了萬億模型M6,節省算力資源超80%,且訓練效率提升近11倍。

四、結語

模型參數規模已越來越大,大模型已成為發展趨勢,為解決超大模型訓練的挑戰,我們自研Whale框架,將不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略。Whale提供簡潔易用的接口,用戶只需添加幾行annotation即可實現各種并行策略,不需要對模型本身進行修改。同時我們結合硬件資源、網絡topo、模型進行軟硬件協同優化,提供高效分布式訓練框架。

通過Whale框架,我們用480 V100 GPU卡訓練萬億規模模型,并在3天內完成模型訓練收斂,為超大規模模型訓練落地提供了可能,后續我們會進一步完善Whale框架,從更大規模、更快速度、更高性價比3個維度去擴展Whale框架的能力。同時也會推動Whale能力在更多業務場景落地,讓技術能力到產品能力的轉變。

 

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2022-03-09 08:05:26

框架分布式開源

2021-06-25 10:40:38

阿里云AIM6

2009-04-16 09:02:30

Eclipse開發平臺版本發布

2017-09-01 05:35:58

分布式計算存儲

2023-10-26 18:10:43

分布式并行技術系統

2023-04-19 16:51:54

分布式Primus開源

2025-10-24 10:41:33

2018-05-19 00:26:13

UAI Train分布式訓練

2019-05-05 08:37:39

分布式PyTorchGPU

2021-02-01 09:35:53

關系型數據庫模型

2021-09-09 15:45:17

機器學習人工智能Ray

2023-06-26 00:14:28

Openjob分布式任務

2025-06-20 14:29:02

模型訓練大數據

2019-06-19 15:40:06

分布式鎖RedisJava

2015-12-14 17:35:21

GemFire12306分布式

2009-12-21 13:47:29

WCF分布式事務

2015-09-24 15:08:28

分布式框架反思分布式系統

2024-09-13 17:02:29

2014-06-30 14:20:05

NoSQL數據庫
點贊
收藏

51CTO技術棧公眾號

999成人网| 人妖一区二区三区| 懂色av中文一区二区三区| 宅男av一区二区三区| 奇米影视一区二区三区小说| 日韩中文在线字幕| 91色porny在线视频| 午夜免费福利小电影| 香蕉一区二区| 在线免费观看高清视频色| 久久精品亚洲精品| 日本一道高清一区二区三区| 日韩中文在线中文网在线观看| 亚洲少妇中出一区| 玖玖综合伊人| 黄污网站在线观看| 在线成人av| 亚洲色图另类专区| 亚洲热app| 欧美一区二区免费观在线| 欧美午夜在线一二页| 国内伊人久久久久久网站视频| 全色精品综合影院| 一级毛片视频| 香蕉久久一区二区不卡无毒影院| 337p粉嫩大胆噜噜噜噜噜91av| 日韩高清国产精品| 91免费看`日韩一区二区| 在线观看av的网站| 国内精品久久影院| 久久最新视频| 僵尸世界大战2 在线播放| 久久久综合亚洲91久久98| 最近中文字幕2019免费| 无码人妻精品一区二区三区在线 | 国产精品久久久久久久美男| 玖玖精品视频| 成a人v在线播放| 亚洲尤物在线视频| 三上悠亚av一区二区三区| 中文字幕亚洲成人| 午夜国产欧美理论在线播放| www 日韩| 超碰在线免费公开| 中文字幕不卡三区视频| 樱桃视频在线观看一区| 一区二区中文视频| 黄色成人av在线| av中文字幕亚洲| 欧美精品一区二区三区在线| 久久一区二区三区喷水| 国产精品入口| 久久国产精品色| 99久久国产综合精品色伊| 国产清纯美女被跳蛋高潮一区二区久久w| 欧美日韩性生活片| 中文字幕一区二区三区域| 69av亚洲| 台湾天天综合人成在线| av动漫免费看| 欧美精选在线播放| 亚洲精品美女久久 | 欧美成人在线网站| 亚洲国产aⅴ精品一区二区| 国产亚洲日本欧美韩国| 久久久免费精品视频| 国产一区二区女| 岛国av在线播放| 蜜桃av噜噜一区| 欧美在线不卡区| 欧美精品久久久久久| 免费一级毛片在线观看| 精品国产一区二区三区日日嗨 | 欧美freesextv| 国产精品一区二区免费不卡| 国产亚洲电影| 麻豆91在线| 少妇人妻大乳在线视频| 国产精品 欧美在线| 3atv在线一区二区三区| 久久久久99精品国产片| 一区精品久久| 欧美人体视频xxxxx| 热久久精品国产| 日韩中文在线视频| 欧美日韩午夜剧场| 91蜜桃在线免费视频| 久久久久久亚洲精品杨幂换脸| 久久久久久久性潮| 国产麻花豆剧传媒精品mv在线| 91精品91久久久久久| 日韩激情片免费| 午夜不卡av在线| 国产清纯美女被跳蛋高潮一区二区久久w| 波多野结衣一区| 筱崎爱全乳无删减在线观看| 伊人75在线| 69久久久久久| 免费看一级大黄情大片| 色爱区成人综合网| 99在线观看| 韩国三级电影久久久久久| 日韩欧美aaaaaa| 一区二区三区国产豹纹内裤在线| 精品亚洲成av人在线观看| 欧美成人久久| 国产精品密蕾丝视频下载| 国产一区二区三区四区五区3d| 成人高清网站| 男同在线观看| 能在线看的av| 色哟哟免费在线观看| 国产黄色免费网| 日本成年人网址| 成人免费看片39| 欧美三级乱人伦电影| 欧美电影免费观看网站| 特黄国产免费播放| 色琪琪原网站亚洲香蕉| 亚洲免费不卡| 天天av综合| 在线播放一区二区精品视频| 成人h版在线观看| 永久免费av在线| 精品三级久久久| 9国产精品午夜| 重囗味另类老妇506070| 亚洲一区日本| 91色乱码一区二区三区| 国产精品久久久久久久久图文区 | 最近2019年中文视频免费在线观看 | 国产主播喷水一区二区| 最新真实国产在线视频| 美女一区二区三区| 欧一区二区三区| 国产精品久久二区二区| 无人区乱码一区二区三区| 成人av三级| 图片区日韩欧美亚洲| 午夜激情综合网| 中文字幕在线乱| 91麻豆6部合集magnet| 国产精品热视频| 鲁丝一区鲁丝二区鲁丝三区| jizz久久精品永久免费| 亚洲图片激情小说| 97电影在线看视频| 久久在线电影| 萌白酱国产一区二区| av今日在线| 欧美一区二区.| 欧美综合色免费| 欧美性猛xxx| 亚洲成人久久一区| 韩国精品久久久999| 国产欧美韩日| 一道本视频在线观看| 日韩av激情| 五月综合久久| 99re这里只有精品首页| 日韩一区二区三区四区五区六区| 日韩一区av在线| 青草青在线视频| 2024最新电影免费在线观看| 99re在线视频| 欧美性xxxx极品hd欧美风情| 国产成人黄色网址| 中文字幕一区二区三区在线播放| 香蕉视频在线网址| 国产一区二区三区在线观看免费视频| 三级欧美在线一区| 亚洲小说区图片区情欲小说| 久久人人爽人人爽人人av| 国模精品一区二区| 欧美国产精品中文字幕| 久久手机视频| 妖精一区二区三区精品视频 | 亚洲天堂av高清| 丁香花在线影院| gogo久久| 日韩精品专区在线影院重磅| 欧美大片黄色| 亚洲天堂第二页| 成人在线免费视频观看| 欧美第一页在线| 日韩精品一区二区三区色欲av| 综合久久综合久久| 日本免费视频在线观看| 青青青草原在线| 国产乱码一区二区三区| 欧美视频在线观看视频| 国产欧美日本一区视频| 久久中文字幕一区| 欧美性久久久久| 女人天堂av手机在线| 欧美精品一区二区三区高清aⅴ | 国内精品中文字幕| 日韩一级免费| 一女二男3p波多野结衣| 日韩视频在线观看一区二区|