国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

訓練MoE足足提速70%!華為只用了三招

人工智能 新聞
為了突破MoE的訓練瓶頸,華為出手了: 構建了一套名為Adaptive Pipe & EDPB的優(yōu)化方案,開啟“上帝視角”,讓MoE面臨“交通擁堵”的訓練集群,實現(xiàn)無等待流暢運行。

Scaling Law之下,MoE(混合專家)如今已經(jīng)成為各大模型廠商擴展模型能力的制勝法寶。

不過,在高效實現(xiàn)模型參數(shù)規(guī)模化的同時,MoE的訓練難題也日益凸顯:

訓練效率不足,甚至一半以上訓練時間都浪費在“等待”上

現(xiàn)在,為了突破MoE的訓練瓶頸,華為出手了:

構建了一套名為Adaptive Pipe & EDPB的優(yōu)化方案,開啟“上帝視角”,讓MoE面臨“交通擁堵”的訓練集群,實現(xiàn)無等待流暢運行。

MoE大規(guī)模訓練難題:一半以上的訓練時間在等待?

實踐已經(jīng)表明,MoE模型訓練集群的效率面臨兩方面挑戰(zhàn):

首先,是專家并行引入了計算和通信等待

當模型規(guī)模較大時,需要切分專家到不同設備形成并行(EP),這就引入額外All-to-All通信。

與此同時,MoE層絕大部分EP通信與計算存在時序依賴關系,一般的串行執(zhí)行模式會導致大量計算單元空閑,等待通信。

其次,負載不均會引入計算和計算等待

MoE算法核心是“有能者居之”,在訓練過程中會出現(xiàn)部分熱專家被頻繁調用,而冷專家使用率較低的情況。

同時,真實訓練數(shù)據(jù)的長度不一,不同的模型層(如稀疏層、嵌入層等)的計算量也存在明顯差異,造成不同卡之間計算也在互相等待。

用一個形象點的說法就是,MoE訓練系統(tǒng)就像一個存在局部交通阻塞的城區(qū),面臨兩大核心問題:

  • 人車混行阻塞:所有車輛(計算)與行人(通信)在紅綠燈交替通行,互相等待。
  • 車道分配僵化:固定劃分的直行、左轉車道就像靜態(tài)的專家分配,導致熱門車道(熱專家)大排長龍,而冷門車道(冷專家)閑置。

針對以上問題,華為團隊打造了“智慧化交通”設施:

首先,建造“行人地下通道”(通信掩蓋技術),徹底分離人車動線,使計算不再等待通信。

其次,部署“智能可變車道”(動態(tài)專家路由),根據(jù)實時車流(數(shù)據(jù)分布)動態(tài)調整車道功能,讓閑置的左轉車道也能分擔直行壓力,實現(xiàn)負載均衡。

這套組合方案既解決了資源分配不均的問題,又消除了通信阻塞的瓶頸,就像為城市交通裝上了“智慧大腦”,讓每個方向的通行效率都得到最大化提升。

DeployMind仿真平臺,小時級自動并行尋優(yōu)

具體來說,華為首先構建了名為DeployMind的仿真平臺,它是一個基于昇騰硬件訓練系統(tǒng)的“數(shù)字孿生”平臺,通過計算/通信/內(nèi)存三維度的多層級建模、昇騰硬件系統(tǒng)的高精度映射、全局化算法加速運行等技術,能在1小時內(nèi)模擬百萬次訓練場景,實現(xiàn)MoE模型多樣化訓練負載的快速分析和自動找到與集群硬件規(guī)格匹配的最優(yōu)策略選擇。

在訓練實踐驗證中,該建模框架可達到90%精度指標,實現(xiàn)低成本且高效的最優(yōu)并行選擇。

針對Pangu Ultra MoE 718B模型,在單卡內(nèi)存使用約束下,華為通過DeployMind以訓練性能為目標找到了TP8/PP16/VPP2/EP32(其中TP只作用于Attention),這一最適合昇騰集群硬件規(guī)格的并行方案,綜合實現(xiàn)計算、通信、內(nèi)存的最佳平衡。

通信掩蓋>98%,讓計算不再等待通信

華為還提出了一套名為Adaptive Pipe的通信掩蓋框架。在DeployMind仿真平臺自動求解最優(yōu)并行的基礎上,采用層次化All-to-All降低機間通信和自適應細粒度前反向掩蓋,實現(xiàn)通信幾乎“零暴露”。

層次化專家并行通信

針對不同服務器之間通信帶寬低,但機內(nèi)通信帶寬高的特點,華為創(chuàng)新地將通信過程拆成了兩步走:

第一步,讓各個機器上“位置相同”的計算單元聯(lián)手,快速地從所有機器上收集完整的數(shù)據(jù)塊(Token);

第二步,每臺機器內(nèi)部先對數(shù)據(jù)塊進行整理,然后利用機器內(nèi)部的高速通道,快速完成互相交換。

這種分層設計的巧妙之處在于,它把每個數(shù)據(jù)塊最多的復制分發(fā)操作都限制在單臺機器內(nèi)部的高速網(wǎng)絡上完成,而在跨機器傳輸時,每個數(shù)據(jù)塊只需要發(fā)送一份拷貝,相比傳統(tǒng)All-to-All通信加速1倍

也就是說,有效通過減少跨機通信,提升了集群的通信速度

自適應細粒度前反向掩蓋

在DualPipe掩蓋框架的基礎上,華為基于虛擬流水線并行技術,實現(xiàn)了更精密的調度,即Adaptive Pipe。

圖片

相比DualPipe,Adaptive Pipe僅利用一份權重,不僅將流水線并行所需的內(nèi)存占用減半,有效降低了計算“空泡”,釋放了流水線的峰值性能潛力;同時,該策略能夠額外實現(xiàn)與分層通信的完美協(xié)同,無縫覆蓋機間與機內(nèi)兩層通信的掩蓋。

在這種層次化通信和細粒度計算通信切分調度優(yōu)化下,Adaptive Pipe可實現(xiàn)98%以上的EP通信掩蓋,讓計算引擎不受通信等待的束縛。

圖片

克服負載不均,訓練再加速25%

由于MoE模型訓練過程中天然存在的負載不均問題,集群訓練效率時高時低,華為團隊還提出了EDPB全局負載均衡,實現(xiàn)專家均衡調度。

在最優(yōu)并行和通信掩蓋基礎上,EDPB再取得了25.5%的吞吐提升收益

圖片

△集群P2P通信分析對比

所謂EDPB,E是專家預測動態(tài)遷移

MoE模型訓練中,設備間的專家負載不均衡如同“蹺蹺板”——部分設備滿載運行,另一些卻處于“半休眠”狀態(tài)。團隊提出了基于多目標優(yōu)化的專家動態(tài)遷移技術,讓專家在分布式設備間“智能流動”。

該技術主要有三個特點:

  • 預測先行,讓專家負載“看得見未來”:預測負載趨勢,實現(xiàn)“計算零存儲開銷,預測毫秒級響應”;
  • 雙層優(yōu)化,計算與通信的黃金分割點:提出節(jié)點-設備雙層貪心優(yōu)化架構,在讓計算資源“齊步走”的同時,給通信鏈路“減負”;
  • 智能觸發(fā),給專家遷移裝上“紅綠燈”:設計分層遷移閾值機制,通過預評估遷移收益動態(tài)決策,實現(xiàn)專家遷移的智能觸發(fā)。

圖片

△基于專家動態(tài)遷移的EP間負載均衡整體框架圖

D是數(shù)據(jù)重排Attention計算均衡

在模型預訓練中普遍采用數(shù)據(jù)拼接固定長度的策略,但跨數(shù)據(jù)的稀疏Attention計算量差異顯著,會引入負載不均衡問題,導致DP間出現(xiàn)“快等慢”的資源浪費。

為解決這一問題,華為團隊提出了一種精度無損的動態(tài)數(shù)據(jù)重排方案,其核心在于:通過線性模型量化單樣本計算耗時,在嚴格保持訓練精度無損下,批次內(nèi)采用貪心算法構建最小化耗時的數(shù)據(jù)重排,實現(xiàn)負載均衡。

P是虛擬流水線層間負載均衡

MoE模型通常采用混合結構,Dense層、MTP層、輸出層所在的Stage與純MoE層所在的Stage負載不均,會造成的Stage間等待。

華為團隊提出虛擬流水線層間負載均衡技術,將MTP層與輸出層分離,同時將MTP Layer的 Embedding計算前移至首個Stage,有效規(guī)避Stage間等待問題,實現(xiàn)負載均衡。

圖片

△基于異構模塊設計的VPP并行負載均衡

系統(tǒng)端到端72.6%訓練吞吐提升

在Pangu Ultra MoE 718B模型的訓練實踐中,華為團隊在8K序列上測試了Adaptive Pipe & EDPB吞吐收益情況。

實驗結果顯示,在最優(yōu)并行策略的初始性能基礎上,華為這套“通信掩蓋+動態(tài)專家遷移”的優(yōu)化方案,能實現(xiàn)系統(tǒng)端到端72.6%的訓練吞吐提升

圖片

總而言之,華為的這套打法可以說是為大模型訓練優(yōu)化提供了關鍵路徑。感興趣的小伙伴可以再通過完整技術報告深入了解——

技術報告地址:

https://gitcode.com/ascend-tribe/ascend-training-system/tree/main/DistributedOptimization

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-12-23 11:10:38

稅收大數(shù)據(jù)大數(shù)據(jù)稅收

2021-03-26 05:59:10

內(nèi)存檢測工具

2025-04-08 00:33:00

數(shù)據(jù)校驗Bean

2020-03-06 08:15:54

新人技術主管陳琦

2021-11-05 08:29:13

數(shù)據(jù)校驗Spring

2015-05-18 09:23:04

JavaScript數(shù)組

2017-05-24 17:25:44

2018-11-07 12:19:18

辭退北大能力

2019-09-01 22:45:53

物聯(lián)網(wǎng)應用開發(fā)操作系統(tǒng)

2022-06-30 12:44:48

黑客數(shù)據(jù)泄露

2023-12-11 15:40:32

PyTorch代碼大模型

2021-06-02 10:06:52

神經(jīng)網(wǎng)絡數(shù)據(jù)圖形

2024-10-28 09:30:00

2025-05-30 08:45:00

數(shù)據(jù)模型訓練

2025-08-22 14:48:27

2024-05-29 14:11:00

2023-09-13 10:09:00

模型數(shù)據(jù)

2022-12-31 13:53:53

工程

2025-07-14 09:18:26

點贊
收藏

51CTO技術棧公眾號

一区二区三区高清不卡| 免费看成年人视频在线观看| 永久在线免费观看| 翔田千里一区二区| 欧美精品久久久久久久久| 欧美尤物美女在线| 亚洲国产电影在线观看| 日韩欧美视频一区二区| 一区二区日韩欧美| 色综合久久88色综合天天看泰| 精品极品在线| 色综合久久88色综合天天6| 凹凸国产熟女精品视频| 成人黄页毛片网站| 亚洲一区二区三区午夜| 青青草原综合久久大伊人精品优势| 国产99久久精品一区二区永久免费| 成人国产综合| 日韩精品一区二区三区在线观看 | 欧美性大战久久| 五月天亚洲激情| 国产欧美日韩三区| 女人被男人躁得好爽免费视频| 黄页视频在线91| 色一情一乱一伦一区二区三区 | 久久99精品国产| 日本不卡二区| 国产精品入口66mio| 国产精品久久二区| 四虎5151久久欧美毛片| 日韩中文字幕网| 91精品亚洲一区在线观看| 亚洲国产一区二区三区在线观看| 成年人在线看| 在线亚洲精品福利网址导航| 中文在线资源在线| 欧美日韩综合在线免费观看| 欧美美乳在线| 欧美成人一区二区| 欧美日韩成人在线播放| 欧洲xxxxx| 午夜日韩电影| 亚洲iv一区二区三区| 国产午夜精品久久| 欧美一区三区三区高中清蜜桃| 嫩草国产精品入口| 国产精品日韩在线一区| 97热在线精品视频在线观看| 欧美国产精品久久| 91欧美激情另类亚洲| 欧美xxav| 性欧美精品一区二区三区在线播放| 亚洲欧美日韩精品一区二区| 欧美日韩三区四区| 成人福利在线看| 中文字幕日本最新乱码视频| 亚洲一区二区免费视频| 免费在线黄色影片| 欧美色老头old∨ideo| 欧美黄色激情| 亚洲精品电影在线观看| 欧美艳星kaydenkross| 成人在线免费电影| 国产国产人免费人成免费视频| 黑人一区二区三区四区五区| 日韩一级裸体免费视频| 日韩夫妻性生活xx| 国产视频精品xxxx| 日本亚洲欧洲无免费码在线| 在线观看精品国产视频| 狠狠一区二区三区| 久久久免费观看| 最新国产拍偷乱拍精品| 亚洲一区二区三区午夜| 久久九九99视频| 污污软件在线观看| 日韩一级完整毛片| 日本妇女一区| 久久精品中文字幕一区二区三区 | 国产精品私人影院| 屁屁影院在线观看| 亚洲精品一区二区三区不| 成人在线视频国产| 国产一区在线观| av中文字幕不卡| 最猛黑人系列在线播放| 亚洲精品国产品国语在线| 91久久偷偷做嫩草影院电| 精品免费国产| 久久综合九色欧美综合狠狠| 性开放的欧美大片| 中国人与牲禽动交精品| 亚洲夜间福利| 国产福利视频在线播放| 欧美一区三区二区| 久久久精品区| 91香蕉电影院| 欧美激情一区二区三区四区| 国产精品久久久久久久免费大片 | 国内精品视频666| 2018av男人天堂| 精品爽片免费看久久| 一区三区在线欧| 日韩中字在线观看| 欧美系列一区二区| av在线不卡顿| 国产在线观看欧美| 亚洲精品精品亚洲| 日韩在线观看中文字幕| 精品视频第一区| 亚洲永久精品国产| 免费视频成人| dy888午夜| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 日本欧美高清| 亚洲熟妇无码av在线播放| 亚洲精品一区二区三区四区高清| 超级碰碰视频| 综合激情成人伊人| 在线免费观看视频黄| 欧美性猛交xxxx免费看| 狠狠操第一页| 欧美在线视频一区二区| abab456成人免费网址| 成人精品在线观看| 不卡av在线免费观看| 国产高清在线a视频大全| 国产精品色视频| 中文字幕在线不卡一区| 三级成人黄色影院| 在线精品日韩| 欧美男女性生活在线直播观看| mm131午夜| 日韩精品一区二区三区swag| 欧美日韩在线网站| 成视人a免费观看视频| 亚洲一区二区三区毛片| 日韩精品欧美激情| 1024精品一区二区三区| 国产av熟女一区二区三区| 日本一区二区高清| 深夜成人福利| 波多野结衣xxxx| 国产亚洲精品一区二区| 青椒成人免费视频| 色在线视频观看| 美女网站免费观看视频| 神马久久桃色视频| 亚洲午夜在线视频| 美女视频黄 久久| 久久97精品| 亚洲性图自拍| 中文字幕日本在线观看| 中文字幕免费在线视频| 欧美一级特黄a| 高清无码视频直接看| 日日摸日日碰夜夜爽无码| 91精品国产毛片武则天| 99中文字幕在线观看| 黄色成人在线免费观看| 这里只有精品66| 麻豆映画在线观看| 中文字幕亚洲第一| 中文字幕一区av| 欧美一级精品片在线看| 日韩av影片| 国产一区二区在线观看免费播放| 欧美性色19p| 岛国精品在线播放| 欧美人与禽猛交乱配视频| 亚洲一区 二区 三区| 亚洲色图网站| 视频一区国产视频| 国产精一区二区三区| 国产精品网站在线观看| 天天爽夜夜爽夜夜爽精品视频| 日韩欧美在线播放| 欧美xxxx做受欧美| 在线播放中文一区| 国产一区二区在线观看免费| 韩日视频在线| 成人精品久久av网站| 亚洲另类在线制服丝袜| 凹凸av导航大全精品| 天天在线视频色| 性欧美大战久久久久久久免费观看| 正在播放亚洲1区| 国产精品国产三级国产| 91蜜桃网址入口| 最新国产乱人伦偷精品免费网站| 一区二区三区毛片免费| 九九热在线视频观看这里只有精品| 2欧美一区二区三区在线观看视频| 黑人精品xxx一区| 欧美一级午夜免费电影| 久久久久久有精品国产| 欧美亚洲激情在线| 欧美在线一区视频| 超碰97免费在线| 亚洲欧洲一级|