国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價 精華

發(fā)布于 2025-2-27 12:40
瀏覽
0收藏

DeepSeek 的開源周已經(jīng)進行到了第四天(前三天報道見文末「相關閱讀」)。今天這家公司一口氣發(fā)布了兩個工具和一個數(shù)據(jù)集:DualPipe、EPLB 以及來自訓練和推理框架的分析數(shù)據(jù)。


DeepSeek 表示,DualPipe 曾在 V3/R1 的訓練中使用,是一種用于計算 - 通信重疊的雙向 pipeline 并行算法。


EPLB 是為 V3/R1 打造的專家 - 并行負載均衡器。


而公布訓練和推理框架的分析數(shù)據(jù)是為了幫助社區(qū)更好地理解通信 - 計算重疊策略和底層實現(xiàn)細節(jié)。


DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

  • DualPipe 鏈接:https://github.com/deepseek-ai/DualPipe
  • EPLB 鏈接:https://github.com/deepseek-ai/eplb
  • 計算分析鏈接:https://github.com/deepseek-ai/profile-data


值得一提的是,在 DualPipe 的 GitHub 上,DeepSeek 創(chuàng)始人梁文鋒位列開發(fā)者行列之中。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

技術語言可能不好理解,我們來看一下網(wǎng)友給出的比喻:


想象一下,訓練一個龐大的語言模型就像指揮一個交響樂團。每個 GPU 就像一位音樂家,執(zhí)行其分配的計算任務,而訓練框架則充當指揮,保持一切完美同步。在典型設置中,音樂家們可能需要等待彼此,造成尷尬的停頓。這些延遲,被稱為流水線氣泡,會減慢整個過程。


DualPipe 通過允許不同部分并行工作來消除這些低效,就像弦樂部演奏的同時銅管部也在排練。這種努力的重疊確保沒有停機時間。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

有網(wǎng)友評價說,「DualPipe 不僅僅是另一種流水線并行實現(xiàn)。它解決的根本問題是標準流水線并行中固有的低效率。傳統(tǒng)方法如 1F1B(一次前向,一次后向)甚至 Zero Bubble(ZB1P)都存在流水線氣泡 —— 即各計算單元等待數(shù)據(jù)時的空閑時間。DualPipe 旨在實現(xiàn)前向和后向計算 - 通信階段的完全重疊,最大限度地減少了這些氣泡。」

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

而關于 EPLB,我們可以這么理解:傳統(tǒng)的數(shù)據(jù)并行就像給每個人一份整個項目的副本 —— 既浪費又緩慢。專家并行(EP),即每個專家駐留在不同的 GPU 上,如果可以平衡負載,則效率要高得多。EPLB 就是為了解決這種專家失衡問題而設計的。這不僅僅是分配專家;它是關于智能地分配它們,以最大限度地提高 GPU 利用率和最小化通信開銷。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

到現(xiàn)在為止,DeepSeek 似乎已經(jīng)把發(fā)布 V3、R1 模型時未公布的很多訓練、部署細節(jié)也公開了出來。人們不僅可以在此基礎上更好地使用 DeepSeek 模型,在使用其他大模型時也能獲得助益。


明天周五,是開源周的最后一天,DeepSeek 有可能用 R2 來收尾嗎?

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

讓我們先來看看今天開源的三個項目。

DualPipe

DualPipe 是在 DeepSeek-V3 技術報告中引入的一種創(chuàng)新的雙向流水線并行算法。它實現(xiàn)了前向和后向計算 - 通信階段的完全重疊,同時減少了流水線氣泡。有關計算 - 通信重疊的詳細信息,請參閱配置文件數(shù)據(jù):https://github.com/deepseek-ai/profile-data

調度

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

DualPipe 調度示例:8 個 流水線并行(PP)級別和 20 個雙向 micro-batch。反向的 micro-batch 與前向的 micro-batch 對稱,因此圖中省略了它們的 batch ID 。被共享的黑色邊框包圍的兩個單元格具有相互重疊的計算和通信。


有網(wǎng)友制作了 DualPipe 與其他兩種方法 ——1F1B and ZB1P 的對比圖:    


DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

Pipeline 氣泡和內存使用情況比較

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

?? 表示前向數(shù)據(jù)塊的執(zhí)行時間,?? 表示完整后向數(shù)據(jù)塊的執(zhí)行時間,?? 表示「權重后向」數(shù)據(jù)塊的執(zhí)行時間,??&?? 表示兩個相互重疊的前向和后向數(shù)據(jù)塊的執(zhí)行時間。


DualPipe由Jiashi Li、Chengqi Deng、梁文鋒創(chuàng)建和開發(fā)。更多信息請參見GitHub代碼庫。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

EPLB

在使用專家并行(Expert Parallelism,EP)時,不同的專家被分配到不同的 GPU 上。由于不同專家的負載可能會根據(jù)當前工作負載而變化,保持不同 GPU 之間的負載平衡非常重要。正如 DeepSeek-V3 論文中所描述的,工程師們采用了冗余專家策略,復制高負載的專家。然后,DeepSeek 通過啟發(fā)式方法將這些復制的專家打包到 GPU 上,以確保不同 GPU 之間的負載平衡。


此外,得益于 DeepSeek-V3 中使用的組限制專家路由(group-limited expert routing),DeepSeek 工程師還盡可能地將同一組的專家放置在同一節(jié)點上,以減少節(jié)點間的數(shù)據(jù)傳輸。


為了便于復現(xiàn)和部署,DeepSeek 在 eplb.py 中開源了部署的 EP 負載平衡算法。該算法根據(jù)估計的專家負載計算出一個平衡的專家復制和放置方案。請注意,預測專家負載的確切方法超出了本倉庫的范圍。一種常見的方法是使用歷史統(tǒng)計數(shù)據(jù)的移動平均值。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

DeepSeek Infra 中的數(shù)據(jù)分析

DeepSeek 公開分享了自身的訓練和推理框架分析數(shù)據(jù),以幫助社區(qū)更好地了解通信計算重疊策略和低級實現(xiàn)細節(jié)。該分析數(shù)據(jù)是使用 PyTorch Profiler 捕獲的。下載后,人們可以通過在 Chrome 瀏覽器中導航到 chrome://tracing(或在 Edge 瀏覽器中導航到 edge://tracing)來直接對其進行可視化。


DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

訓練配置文件數(shù)據(jù)展示了 DeepSeek 在 DualPipe 中針對一對單獨的前向和后向塊的重疊策略。每個塊包含 4 個 MoE(專家混合)層。并行配置與 DeepSeek-V3 預訓練設置一致:EP64、TP1 具有 4K 序列長度。并且為簡單起見,在分析過程中不包括 PP 通信。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

在推理上,對于預填充,該配置文件采用 EP32 和 TP1(與 DeepSeek V3/R1 的實際在線部署一致),提示長度設置為 4K,每 GPU 的批大小為 16K 個 token。在預填充階段,DeepSeek 使用兩個 micro-batch 來重疊計算和全對全通信,同時確保注意力計算負載在兩個微批次之間保持平衡 —— 這意味著同一個提示可以在它們之間拆分。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

對于解碼,該配置文件采用 EP128、TP1 和 4K 的提示長度(與實際的在線部署配置非常接近),每個 GPU 的批處理大小為 128 個請求。與預填充類似,解碼也利用兩個 micro-batch 進行重疊計算和全對全通信。但是,與預填充不同,解碼期間的全對全通信不占用 GPU SM:發(fā)出 RDMA 消息后,所有 GPU SM 都被釋放,系統(tǒng)等待計算完成后全對全通信完成。

DeepSeek 錯峰優(yōu)惠,半夜跑 AI 更省錢

除了持續(xù)開源,DeepSeek 這兩天還宣布了一些重要消息:一是恢復 API 開放平臺充值;二是北京時間每日 00:30 至 08:30 的夜間空閑時段,推出錯峰優(yōu)惠活動。在此期間,API 調用價格大幅下調:DeepSeek-V3 降至原價的 50%,DeepSeek-R1 更低至 25%。這一使用方式被網(wǎng)友稱為「峰谷 token」。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

有人利用峰谷電特點半夜洗碗、烘衣服,自然也有人半夜跑 AI 任務。有用戶表示,「一些批量的任務可以到晚上讓它自動運行了」「DeepSeek 是懂年輕人的」。


而在大洋彼岸,需要 DeepSeek 的打工人正常時段就可以享受到優(yōu)惠,美國打工人高呼「真香」。

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

所以,現(xiàn)在壓力給到了其他 API 供應商,這波降價潮,其他家跟不跟?  

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

DeepSeek一口氣開源3個項目,還有梁文鋒親自參與,昨晚API大降價-AI.x社區(qū)

本文轉自 機器之心  ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/aeK5eJMwqNuqJaZczKrhgQ??

收藏
回復
舉報
回復
相關推薦
中文字幕在线网| 亚洲一区二区久久久久久| **欧美日韩vr在线| av噜噜色噜噜久久| 秋霞在线午夜| 亚洲第一视频网| 蜜桃导航-精品导航| 国产尤物久久久| 亚洲区免费影片| 欧美xxxx免费虐| 在线观看免费视频综合| 青青草国产成人av片免费| 国产精品美女久久久浪潮软件| 91av国产在线| 欧美高清你懂的| 亚洲级视频在线观看免费1级| 性色视频在线| 依依成人精品视频| 黄大色黄女片18第一次| 波多野结衣中文字幕一区| 中文字幕一区二区三区四区五区 | 久久99久久99精品| 视频精品一区二区| 国产麻豆一区二区三区在线观看| 91一区二区三区四区| 国产精品你懂得| 日韩av久操| 国自产拍在线网站网址视频| 欧美成人精品| 91成人免费看| 欧美全黄视频| 精品国产乱码久久久久久108| 在线日韩中文| 欧美精品成人一区二区在线观看| 夜夜嗨av一区二区三区网站四季av| av蓝导航精品导航| 日韩午夜在线电影| 久久久人人爽| 亚洲激情在线| 欧美在线一二三区| 精品一区二区三区在线视频| 成人午夜免费在线视频| 日本在线观看a| 成人欧美一区二区三区白人 | 欧美激情综合色| 九色中文视频| 亚洲黄色小视频| 男人本色网站| 日韩欧美在线视频日韩欧美在线视频| 麻豆app在线观看| 欧美猛男男办公室激情| 免费在线观看av电影| 亚洲欧美日韩中文视频| 高清不卡一区| 日本亚洲欧洲色| 亚洲免费二区| 日日夜夜精品网站| 国产精品一区免费视频| 国产成人a亚洲精v品无码| √…a在线天堂一区| 欧美新色视频| 亚洲国产成人精品女人久久久| 成人激情视屏| 青草成人免费视频| 亚洲第一黄色| 成人小视频在线观看免费| 中文字幕不卡三区| 日韩a在线观看| 精品国产乱码久久久久久夜甘婷婷| 日韩免费福利视频| 91爱爱小视频k| 亚洲激情婷婷| 人妻互换免费中文字幕| 一区精品在线播放| 黄色精品在线观看| 有码中文亚洲精品| 残酷重口调教一区二区| 天堂资源在线亚洲视频| 国产亚洲综合av| 久久天堂电影| 中文字幕精品在线视频| 日韩在线观看一区| 91制片厂免费观看| 一区二区三区在线视频观看58 | 黄色录像1级片| 欧美高清性hdvideosex| 日韩免费一级| 激情伦成人综合小说| 不卡一区中文字幕| 黄页网站在线播放| 日韩久久免费视频| 一区二区三区四区在线看| 欧美一区二区三区四区夜夜大片| 99久久精品99国产精品| av资源种子在线观看| 另类专区欧美制服同性| 国产亚洲精品v| 久草在线资源网站| 精品视频在线导航| 亚洲精品一区二区妖精| 成人一区二区免费视频| 欧美久久久久久久久| 校园春色另类视频| 中文字幕乱码免费| 黑人精品xxx一区一二区| 456成人影院在线观看| 国产伦精品一区二区三区四区免费| 久久久亚洲精品一区二区三区| 国产超级va在线视频| 国产精品久久久久久搜索 | 亚洲熟妇无码一区二区三区| 婷婷开心激情综合| 国产精品2区| 日韩欧美一区二区视频在线播放 | 日本不卡一区二区三区在线观看| 亚洲日本电影在线| 99精品国产九九国产精品| 久久亚洲高清| 一本色道久久综合亚洲91| 日韩高清成人在线| 日本中文字幕片| 亚洲人精品午夜在线观看| 国产精品久久777777毛茸茸| 爽爽免费视频| 欧美激情手机在线视频 | 激情丁香综合五月| 国产资源在线看| 91精品国产综合久久香蕉922| 国产片一区二区| 亚洲久草在线| 国产免费一区二区视频| 精品人在线二区三区| 亚洲黄色影片| 99riav在线| 国产午夜精品在线| 欧美在线综合视频| 国产一区视频在线观看免费| 亚洲色图图片网| 成人免费网站在线| 天天做天天摸天天爽国产一区| 性欧美lx╳lx╳| 国产偷人视频免费| 久久精品国产96久久久香蕉| av不卡免费电影| 全球中文成人在线| 国模无码视频一区二区三区| 北条麻妃在线一区二区| av高清久久久| 亚洲日本va| 激情婷婷综合网| 欧美激情一级二级| 亚洲婷婷综合色高清在线| 亚洲性视频大全| 黄动漫在线免费观看| 亚洲999一在线观看www| 欧洲视频一区二区| 午夜一区二区三区不卡视频| 色婷婷av在线| 中文字幕精品—区二区日日骚| 亚洲欧美国产精品专区久久 | 欧美亚洲一区在线| 国产精品福利在线播放| 女人丝袜激情亚洲| 国产呻吟对白刺激无套视频在线| 国产精品欧美久久久| 五月婷婷综合在线| 亚洲黄色免费| 超碰资源在线| 阿v天堂2017| 2019日本中文字幕| 精品人伦一区二区三区蜜桃网站| 欧美激情五月| 黄色精品免费看| 99中文字幕在线观看| 欧美成人黑人xx视频免费观看| 亚洲欧美另类图片小说| 中文字幕av亚洲精品一部二部| 日本欧美国产| 777电影在线观看| 一区二区三区电影| 色偷偷88888欧美精品久久久 | 亚洲xxx自由成熟| 精品人伦一区二区色婷婷| av在线不卡观看免费观看| 九九热精品视频在线观看| av网站大全在线观看| 裸体裸乳免费看| 69久久夜色精品国产7777| 欧美视频一区在线观看| 老汉av免费一区二区三区| 年轻的保姆91精品| 美国一级片在线免费观看视频 | 久久久久久久久久久91| 第一福利永久视频精品| 极品少妇xxxx精品少妇| 精品中文视频| 大片免费播放在线视频| 日韩精品视频一区二区在线观看| 成人有码在线播放| 日韩激情av在线免费观看|