国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

阿里 HPN:針對大規模 LLM 訓練的萬卡集群

發布于 2024-6-27 15:42
瀏覽
0收藏

一、背景

之前的文章中我們具體介紹了萬卡 GPU 集群中的網絡拓撲以及在萬卡 GPU 集群中進行大規模 LLM 訓練面對的挑戰和解決方案;也進一步介紹了阿里云的集合通信調度框架 C4 和 C4 底層的阿里云新一代智算集群網絡架構 HPN 7.0。不過上述 HPN 7.0 的相關介紹都是基于阿里官網或者之前的公開分享,最近阿里正式公布了 HPN 相應的 Paper,與我們之前了解到的稍有不同,此處進行相應補充。有關雙上聯、雙平面介紹這里不再贅述。

對應的論文:??https://ennanzhai.github.io/pub/sigcomm24-hpn.pdf??

上面提到的幾個介紹可以參考:

二、拓撲

如下圖所示為我們之前介紹的拓撲方式(圖片來自 Revolutionizing Data Center Networks: Alibaba’s SONiC Journey),是一個完全無收斂的方案。對于下圖的拓撲中:

  • 每個 Segment 有 128 個節點,共 1024 GPU(單層千卡)。
  • 每個 Pod 有 8 個 Segment,也就是每個 Pod 有 8192 GPU。
  • 總共有 128 個 Pod,也就是可以支持 1,048,576 個 GPU(三層 100 萬)。?

阿里 HPN:針對大規模 LLM 訓練的萬卡集群-AI.x社區

如下圖 Figure 7 所示,在 HPN Paper 中的拓撲方式與我們之前看到的稍有不同(雙上聯、雙平面等思路都是完全一樣的),我們這里簡單進行介紹:

  • 下面的拓撲中包含了前向網絡(Frontend Network)和后向網絡(Backend Network):

后向網絡:有收斂,使用每個節點 9 個 NIC 中的 NIC1-NIC9 這 8 個互聯,主要用于大規模分布式訓練,并且一個 GPU 連接一個 NIC。

前向網絡:無收斂,使用每個節點 9 個 NIC 中的 NIC0 互聯。為了支持更多的場景,比如訓練/推理混部,模型傳輸,數據加載等場景。

  • 后向網絡依然是 3 層:
  • Segment:依然采用雙上聯方式,一個 NIC 上有 2 個 200Gbps 的 Port(PS:沒有采用之前介紹的 2 個 200 Gbps NIC 的方式),會連接兩個不同的 ToR 交換機。

一個 Segment 里面依然有 16 個 ToR 交換機,每個交換機 128 個 400Gbps Port,但是有 60 連接 Spine 交換機,68 個連接節點的 NIC。

68 個 400Gbps Port 可以對應 136 個 200Gbps NIC Port,也就是一個 Segment 里面 136 個節點,共 138*8=1104 個 GPU。

實際上 136 個節點中有 8 個是備份,以便節點故障(比如 GPU、網卡、硬盤、CPU 等)時可以快速替換。實際使用 128 個節點,共 1024 GPU,對應的網絡收斂比為 (1024*400)/(60*400*16)=1.067:1。

Pod:一個 Pod 中的 Segment 從 8 個變成 15 個,所以最多能支持 15*1024=15K GPU。

  • 在 Spine(Agg)交換機上采用 15:1 的收斂比,因此可以有更多的下行 Port 連接 Leaf 交換機。
  • 具體來說,每個 Spine 交換機有 120 個 Port 連接 Leaf 交換機,也就可以連接 120/8=15 個 Segment(每個 Segment 里面同一平面的 8 個 Leaf 交換機連接到同一個 Spine 交換機)。
  • Cluster:一個 Cluster 可以包含多個 Pod,通過 Core 交換機連接。
  • Spine(Agg) 交換機有 8 個 Port 連接 Core 交換機。這個是為了支持更大規模的 GPU,比如 8 個 Pod,則可以支持 120K GPU。
  • 在大規模模型訓練時,可以將 PP(Pipeline Parallelism)中的不同切片放在不同的 Pod,這樣跨 Pod 的通信量比較小,也就不容易出現瓶頸。?

阿里 HPN:針對大規模 LLM 訓練的萬卡集群-AI.x社區

三、附錄

3.1 單 Segment 千卡

如下圖 Figure 6 所示,生產環境中 96.3% 的訓練任務需要的 GPU 數都不超過 1024 GPU,也就是都可以放在 1 個 Segment 里,這樣通信是非常高效的,不同 GPU 通信最多只用經過 1 跳即可:

阿里 HPN:針對大規模 LLM 訓練的萬卡集群-AI.x社區

3.2 多 Pod 互聯

HPN 中在 Core 交換機上采用 15:1 的收斂比,也就是有額外 87.5% 的 Port 可以用于同一個 Pod 中的 Segment。所以同一個 Pod 的 Segment 從 8 個變成 15 個,GPU 數從 8192 增加到 15360,可以支持更多的任務在同一 Pod 內執行。同一個 Pod 內的 GPU 通信最多只用通過 3 跳即可,而如果是 3 Tier 網絡,則最多可能需要 5 跳。

那么為什么沒有直接搞成 2 Tier 網絡呢?主要是還需考慮到技術的演進,模型在不斷擴大,訓練的數據也越來越多,相應需要的 GPU 也就越來越多,這就很難說是否未來的某一天需要超過 15K GPU 來訓練大模型。與此同時,大模型訓練通常會使用 DP(Data Parallelism)、TP(Tensor Parallelism)和 PP(Pipeline Parallelism)技術,而 PP 相對 DP 和 TP 的通信量要小得多,如下圖 Table 3 所示(GPT-175B,TP=8,PP=8,DP=512),因此就可以考慮為其提供較低的通信帶寬,比如跨 Pod。

阿里 HPN:針對大規模 LLM 訓練的萬卡集群-AI.x社區

3.3 大規模預訓練對比

如下圖 Figure 20 所示為作者原來使用的 DCN+ 集群拓撲,采用無收斂設計。一個 Segment 中只有 16 個節點,128 個 GPU,一個 Pod 只有 512 個 GPU:

阿里 HPN:針對大規模 LLM 訓練的萬卡集群-AI.x社區

作者用一個相同的 LLM 預訓練任務進行了對比,該任務需要 2300+ GPU,共 288+ 個節點,訓練幾個月。在 DCN+ 中需要至少 5 個 Pod,19 個 Segment,而在 HPN 中只需要 3 個 Segment。如下圖 Figure 15所示:

  • 15a:端到端訓練吞吐提升 14.9%。
  • 15b:跨 Segment 流量平均降低 37%。
  • 15c:Agg 交換機下行隊列長度大幅降低。

?

阿里 HPN:針對大規模 LLM 訓練的萬卡集群-AI.x社區

四、參考鏈接

  1. ??https://ennanzhai.github.io/pub/sigcomm24-hpn.pdf??
  2. ??https://sonicfoundation.dev/revolutionizing-data-center-networks-alibabas-sonic-journey/??

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
老司机在线视频二区| 国产主播精品| 中文字幕在线不卡视频| 国产小视频免费| a天堂在线资源| 99香蕉国产精品偷在线观看| 成人av综合一区| 亚洲av综合色区| 成人国产精品| 日本成人超碰在线观看| 色悠久久久久综合欧美99| 美女福利视频一区| a天堂中文在线官网| 最新精品国产| 午夜精品久久久久影视| 欧美激情精品久久久久久免费印度| 樱空桃在线播放| 欧美日本一道| 美女黄色成人网| 中国china体内裑精亚洲片| 福利视频一二区| а√在线中文网新版地址在线| 久久久久国产精品| 久久亚洲美女| 精品美女被调教视频大全网站| 91亚洲永久免费精品| 三区在线观看| 毛片av中文字幕一区二区| 亚洲欧美一区二区三区在线 | 夜色福利刺激| 欧美在线日韩| 色一区在线观看| 日韩成人激情视频| 男人的天堂狠狠干| 56国语精品自产拍在线观看| 国模私拍视频在线播放| 午夜久久福利| 日本精品免费观看高清观看| 产国精品偷在线| 老司机亚洲精品一区二区| 国产精品素人一区二区| 午夜免费日韩视频| 成年人视频在线看| 国产精品一卡二卡三卡| 日韩国产高清影视| 国产精品丝袜在线| 欧洲亚洲一区二区| 高清久久久久久| 国产一区二区三区在线免费观看| 欧美夫妻性视频| 黄页在线观看| 国产精品九九| 少妇久久久久久| 欧美a免费在线| 亚洲区在线播放| 国产一区二区三区四区在线观看| 最新97超碰在线| 国产精品网址在线| 成人av高清在线| 最新中文字幕在线视频| 图片区小说区区亚洲影院| 五月婷婷在线观看| 91精品视频免费看| 国产呦精品一区二区三区网站| 国产精品video| 亚洲精品偷拍| 色七七在线观看| 欧美中文一区二区三区| 亚洲成人av观看| 亚洲精品成人悠悠色影视| 午夜网站在线观看| 亚洲少妇诱惑| 久久精品magnetxturnbtih| 一区视频二区视频| 捆绑紧缚一区二区三区在线观看| 一区在线播放视频| 亚洲男人天堂| 日韩一区二区三区电影在线观看 | 欧美在线观看一区| 六十路在线观看| 欧美精品一区视频| 卡通动漫国产精品| 国产97在线视频| 毛片av中文字幕一区二区| 热舞福利精品大尺度视频| 国产色91在线| av成人手机在线| 国模视频一区二区| 韩国欧美国产一区| 黄色一级影院| 久久精品视频导航| 乱一区二区av| 天堂av电影在线观看| 欧美激情va永久在线播放| 欧美深夜福利| www.亚洲高清| 色哟哟网站入口亚洲精品| 欧美精品尤物在线观看| 日韩欧美精品免费| 久久久国产精品麻豆| 91av俱乐部| 欧美日韩一区二区精品| 国产一区不卡精品| 亚洲视频在线播放| 国产精品天堂蜜av在线播放| 欧美亚洲另类在线一区二区三区| 91精品在线观看视频| 最近2019中文字幕mv免费看| 91视频综合| 91av资源在线| 日日橹狠狠爱欧美超碰| 欧美日韩成人在线观看| 老司机精品视频在线| 三级毛片在线免费看| 国产精品网站视频| 一区二区三区四区视频精品免费 | 国产日韩欧美一区二区三区综合| 精品女厕厕露p撒尿| 蜜臀久久99精品久久久久久宅男| 韩国精品在线观看| 黄网站免费在线观看| 日本一区二区精品视频| 欧美一区二区三区免费视频| 欧美hd在线| 在线观看的网站你懂的| 九色精品美女在线| 久久久免费毛片| 国产999精品久久久影片官网| 久久66热偷产精品| 伊人久久一区| 欧美极品在线| 亚洲午夜精品| 成人短视频在线| 中文字幕在线二区| 成人中文字幕在线播放| 国产欧美日产一区| 欧美精品videosex牲欧美| 久久久人人人| 日韩国产网站| 少妇无码av无码专区在线观看 | 欧美福利一区二区三区| 在线一区二区三区四区五区 | 欧美性猛交xxxx富婆弯腰| 国产精品久久久久一区二区三区厕所| 欧洲伦理片一区 二区 三区| 欧洲亚洲一区二区| 欧美高跟鞋交xxxxhd| 一区二区三区精品在线| 日本午夜一区二区| 色135综合网| 欧美最新精品| 污视频网站在线免费观看| 俄罗斯精品一区二区三区| 欧美日韩另类在线| 最新国产一区二区| 国产日本韩国在线播放| 欧美日韩在线免费观看视频| 性欧美18一19内谢| 高清免费观看在线| 国产中文在线观看| 男女免费观看在线爽爽爽视频| 图片区小说区亚洲| 色老太综合网| 国产精品亚洲一区二区在线观看 | 亚洲国产视频直播| 影音先锋久久久| 97久久亚洲| 日本韩国欧美| 国产写真视频在线观看| 精品久久av| 色影视在线视频资源站| 99re热在线观看| 无码专区aaaaaa免费视频| 91制片厂免费观看| 亚洲一区二区精品在线观看| 久久av一区二区三区漫画| 波多野结衣久草一区| 国产精品av在线播放| 中文字幕av一区| 亚洲精品午夜精品| 欧美精品第1页| 亚洲国产91精品在线观看| 亚洲欧美日韩小说| 日韩啪啪电影网| 黄动漫在线看| 久操网在线观看| 欧美图片激情小说| 4438x成人网全国最大| 国内综合精品午夜久久资源| 韩国三级在线一区| 精品久久久视频| 美女少妇精品视频| 国模一区二区三区私拍视频| 一区二区三区入口| 性chinese极品按摩| 九色视频网站| 免费黄色网页在线观看| 午夜伦理在线视频| a一区二区三区| 国产综合激情|