国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

一起聊聊面向E級計算的四款高性能處理器

商務(wù)辦公
本文主要分析和探討國際上面向 E 級計算的先進(jìn)高性能處理器的核心運(yùn)算架構(gòu),包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能處理器,著重關(guān)注運(yùn)算資源組織結(jié)構(gòu)、數(shù)據(jù)和指令級并行方式、領(lǐng)域?qū)S眉铀俳Y(jié)構(gòu) DSA、支持?jǐn)?shù)據(jù)類型和算力等方面。

商用高性能計算處理器市場主要被NVIDIA、AMD和Intel3家公司長期占據(jù),在面向E級計算 的 高 性 能 處 理 器 中,AMD 最 新 的Instinct MI250X處理器雙精度浮點(diǎn)運(yùn)算能力已經(jīng)高達(dá)95.7TFlops,NVIDIA和Intel最新發(fā)布的高性能處理器峰值性能也均達(dá)到了數(shù)十 TFlops。

本文主要分析和探討國際上面向 E 級計算的先進(jìn)高性能處理器的核心運(yùn)算架構(gòu),包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能處理器,著重關(guān)注運(yùn)算資源組織結(jié)構(gòu)、數(shù)據(jù)和指令級并行方式、領(lǐng)域?qū)S眉铀俳Y(jié)構(gòu) DSA、支持?jǐn)?shù)據(jù)類型和算力等方面,并總結(jié)和展望主流高性能處理器的運(yùn)算架構(gòu)研究發(fā)展現(xiàn)狀和趨勢,以期為國內(nèi)自主研發(fā)面向后 E 級計算的高性能處理器提供技術(shù)參考和借鑒。

1、Fujitsu A64FX

Fujitsu A64FX 是由富士通(Fujitsu)在2018年發(fā)布的,主要用于構(gòu)建日本原計劃研發(fā)的首臺 E級計算機(jī) “后 京”(POST-K)[6],后 改 名 為 “富 岳”(Fugaku)并于2020年6月發(fā)布。目前,“富岳”超算在全球高性能計算機(jī) TOP500榜單中排名第2,集成的 A64FX處理器芯片數(shù)量高達(dá)158976片,全機(jī)峰值性能為0.537212EFlops,Linpack實測性能為0.44201EFlops,效率為82.28%。

圖片

A64FX處理器結(jié)構(gòu)框圖如圖1所示,分成4個處理核心存儲組 CMG(CPU MemoryGroup),每個 CMG 包含13個同構(gòu)核心、L2Cache和存儲控制器,其中12個核心為計算核心,1個為輔助核心,用于運(yùn)行操作系統(tǒng)和I/O 操作,全片共52個核心。每個 CMG 集成8GB 容量的 HBM2存儲器,全片總?cè)萘繛?2GB,總帶寬為 1024GB/s。

片上還集成了 PCIe3.016x接口和富士通特有的TofuD互連網(wǎng)絡(luò)接口與路由器,這些外接口與4個CMG 通過片上網(wǎng)絡(luò) NoC(NetworkonChip)實現(xiàn)互連和通信。

A64FX 處理器采用臺積電7nm 工藝和 CoWoS封裝實現(xiàn),集成了87.86億晶體管,最高運(yùn)行頻率為2.2GHz,峰值性能為3.3792TFlops,功耗為200W。

2、NVIDIA H100

NVIDIA 在 HPC 和 人 工 智 能 AI商用處理器市場占比非常高,一直是圖形處理器 GPU領(lǐng)域的佼佼者。TOP500最新榜單排行前20的超算系統(tǒng)中有11臺采用了 NVIDIA 的 GPU 實現(xiàn)。目前這些超算算力主要由前兩代 GPU 產(chǎn)品 V100和A100提供。

圖片

NVIDIA 于2022年3月發(fā)布了面向 HPC 和AI的最新款高性能處理器 H100GPU。該處理器采用 新 一 代 HOPPER 架 構(gòu),基 于 上 一 代 GPUA100的 Ampere架構(gòu)主要進(jìn)行了如下擴(kuò)展:

  • (1)集成第4代張量核心(TensorCore);
  • (2)新增動態(tài)規(guī)劃算法加速指令 DPX;
  • (3)流多處理器 SM內(nèi) CUDA核 數(shù) 量 翻 倍;
  • (4)與GPC相對應(yīng),強(qiáng)化線程塊簇特征;
  • (5)新增 TMA引 擎,增 強(qiáng) 異 步 數(shù) 據(jù) 傳 輸 功 能;
  • (6)定 制Transformer引 擎,以 加 速 Transformer 模 型 訓(xùn)練;
  • (7)更新?lián)Q代 HBM3、PCIe5.0和第4代 NVLink等存儲和外接口。

H100的結(jié) 構(gòu) 框 圖如 圖 2 所 示,全 片 實 際(非 GH100架構(gòu)滿配)集成了132個 SM,每2個SM 構(gòu)成一個 TPC(TextureProcessingCluster),9個或8個 TPC構(gòu)成一個 GPC,全片共8個 GPC。

每個SM 包含128個 FP32(單精度浮點(diǎn))CUDA核和 4 個 TensorCore,全片共 16896 個 CUDA核,528個 TensorCore。

H100GPU 片上集成了50MB的L2Cache,5個16GB容量的 HBM3,存儲總?cè)萘繛?0GB,總訪存帶 寬 為 3 TB/s。此 外,片 上 還 集 成 了 PCIe 5.0 16x和第 4 代 NVLink 外接口,支 持 與 CPU或 GPU 高速互連。

H100GPU 采 用 臺 積 電 為 NVIDIA 定 制 的4N 工藝和 CoWOS封裝實現(xiàn),全片集成了800億個晶體管,運(yùn)行頻率為1.776GHz(根據(jù)雙精度浮點(diǎn)峰值性能和全片集成運(yùn)算部件數(shù)量推算得到),峰值性能為 60.0TFlops,TDP功耗為700 W。

3、AMD MI250X

為進(jìn)一步加強(qiáng)在 HPC領(lǐng)域的影響力,AMD將旗下通用 GPUGP拆分成 RDNA(RadeonDNA)和 CDNA(ComputeDNA)架構(gòu),前者主要面向?qū)崟r游戲和圖形處理,后者主要面向 HPC應(yīng)用。

CDNA 架構(gòu)目前已經(jīng)發(fā)展到第2代 MI200,代表高性能處理器是 MI250X發(fā)布于2021年11月,并用于構(gòu)建美國E級超算“前線”(Frontier)。“前 線”超 算 發(fā) 布 于 2022 年 5 月 30日,在全球高性能計算機(jī) TOP500榜單中排名第1,集成的 MI250X 處理器芯片數(shù)量高達(dá)36992片,全機(jī)峰值性能為1.68565EFlops,Linpack實測性能為1.102EFlops,效率為65.38%。

圖片

MI250X處理器采用 AMD 特有的先進(jìn)3D封裝技 術(shù) 集 成 2 個 MI200 GCD(GraphicsComputeDie),2個 GCD 間通過無盡互連IF(Infinit Fabric)接口直連實現(xiàn)高帶寬通信。MI250X 處理y器中單個 GCD(非 MI200滿配)結(jié)構(gòu)框圖如圖3所示,包含4個計算引擎 CE(ComputeEngine),每個 CE內(nèi)含27或28個計算單元 CU(ComputeUnit)。MI250X 處 理 器 全 片 2 個 GCD 共 220 個CU;集成了16 MB 的 L2Cache;8個16GB 容量的 HBM2E,總?cè)萘繛?28GB、總帶寬為3.2TB/s;8路IFLink或者6路IFLink加PCIe4.0接口(2路IF接口可重構(gòu)配置成 PCIE4.0接口),支持GPU 和 CPU 多種可擴(kuò)展高速互連。

MI250X處理器采用臺積電 N6工藝實現(xiàn),全片集成了 582 億個晶體管,運(yùn)行頻率最高為 1.7GHz,峰值性能為 95.7TFlops,是首個峰值性能接近 100 TFlops的 高 性 能 處 理 器,TDP 功 耗 為560 W。

4、Intel PonteVecchio

Intel一直致力于重新贏得 HPC 領(lǐng)域的高性能處理器領(lǐng)導(dǎo)者地位,其精心打造的面向 E 級計算的高性能處理器 PonteVecchio于2021年8月在Intel體系結(jié)構(gòu)日上發(fā)布,2023年1季度已上市。PonteVecchio處理器將用于構(gòu)建2臺美國 E級計 算 機(jī) “極 光”(Aurora)和 “酋 長 巖”(ElCaptain),并為其提供主要算力,預(yù)計“極光”的超算峰值性能為1.0EFlops、“酋長巖”的超算峰值性能為2.0EFlops。

PonteVecchio處理器采用 X HPC架構(gòu)實現(xiàn),結(jié)構(gòu)框圖如圖4所示。

圖片

PonteVecchio處理器通過多種先進(jìn)封裝集成2個同構(gòu)的 Stack,Stack 間通過高速直連接口互連;全片共8個 Slice,每個 Slice包含16個 X 核心,總計128個 X 核心;全片集成了144 MB的共享 L2Cache;8個 HBM2E,總帶寬超過5TB/s;16路 X Link,支持多 CPU 間高速直連,總帶寬超過2TB/s;此外還集成了 PCIe5.0接口。

PonteVecchio處理器采用 5 種先進(jìn)工藝實現(xiàn),包括臺積電5nm、7nm 和Intel 7nm 等,全片多 達(dá) 47 個 Tile (Die),通 過 Foveros和 EMIB等多種先進(jìn)封裝技術(shù)集成。全片集成了超過1000億個晶體管,運(yùn)行頻率為1.373GHz(根據(jù)單精度浮點(diǎn)峰值性能和全片集成運(yùn)算部件數(shù)量推算得到),峰值性能超過45.0TFlops(雙精度浮點(diǎn)與單精度浮點(diǎn)相同),功耗暫無官方數(shù)據(jù)。

5、小結(jié)

4款面向 E級計算的高性能處理器參數(shù)與對比統(tǒng)計信息如表1所示,4款處理器均采用臺積電7nm 或更先進(jìn)工藝,集成密度高、晶體管數(shù)目龐大,通過先進(jìn)封裝集成高帶寬存儲器 HBM 提供TB/s級訪存帶寬,并采用商用大容量存儲顆粒。

圖片

工作頻 率 方 面,A64FX 的 較 高,達(dá) 到 了 2.2GHz,H100 和 MI250X 的 均 在 1.7 GHz 左 右,PonteVecchio的最低為1.373GHz;

峰值性能方面,A64FX 是唯一峰值性能低于10.0TFlops的處理器,其他3款的均超過45.0TFlops,MI250X的甚 至 高 達(dá) 95.7 TFlops;

功 耗 方 面,H100 和MI250X的均超過 500 W,PonteVecchio的無官方數(shù)據(jù),預(yù)計也會超過500W。

先進(jìn)封裝技術(shù)方面,均采用了2.5D 或3D 封裝,MI250X 還通過 EFB封裝集成了2個 GCD,而 PonteVecchio采用 Foveros+EMIB 封裝集成超過47個 Die,并通過多種先進(jìn)工藝分別實現(xiàn)了計算 Die、存儲 Die和互連 Die。

作者:吳鐵彬、過鋒、王諦

責(zé)任編輯:武曉燕 來源: 架構(gòu)師技術(shù)聯(lián)盟
相關(guān)推薦

2025-03-13 05:00:00

2024-02-26 00:00:00

Go性能工具

2016-07-07 11:00:54

聯(lián)想

2025-06-11 02:10:00

2024-07-11 08:26:00

2024-08-06 08:27:51

2021-11-04 06:58:31

CSS性能設(shè)備

2023-12-29 08:29:15

QPS系統(tǒng)應(yīng)用

2024-02-02 09:21:57

API性能策略

2025-04-16 08:01:05

Ceph對象存儲

2023-04-26 07:30:00

promptUI非結(jié)構(gòu)化

2022-10-08 00:00:05

SQL機(jī)制結(jié)構(gòu)

2024-12-30 08:03:08

2021-08-27 07:06:10

IOJava抽象

2022-12-07 09:01:14

布局容器VStack?

2024-02-20 21:34:16

循環(huán)GolangGo

2023-03-29 08:13:48

MySQL檢索成本

2023-06-09 08:06:14

操作系統(tǒng)調(diào)度器LLM

2023-08-10 08:28:46

網(wǎng)絡(luò)編程通信

2023-08-04 08:20:56

DockerfileDocker工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

bbbbbbbbbbb在线视频| 99在线视频影院| 国产精品日本| 中文字幕一区日韩电影| 999www成人| 国产在线麻豆精品观看| 国产成人拍精品视频午夜网站 | 99综合精品| 久久久免费高清电视剧观看| 中文字幕中文字幕在线中高清免费版| 国产欧美日韩在线看| 天堂av一区二区| 欧美不卡在线| 国产成人综合一区二区三区| 亚洲欧美专区| 亚洲欧洲美洲在线综合| 日本中文字幕电影在线免费观看| 亚洲色图.com| 久久精品网站视频| 国产成人av一区二区三区在线| 国产综合动作在线观看| 成人av国产| 国产成人精品av在线| 榴莲视频成人app| 亚洲系列中文字幕| 欧美大胆的人体xxxx| 91国产视频在线观看| 黄色激情网站| 中文字幕在线不卡一区 | 99re6这里只有精品| 国语自产精品视频在线看抢先版图片| 亚洲v.com| 亚洲国产精久久久久久久| 婷婷在线视频| 在线中文字幕一区| 理论片在线观看理伦片| 亚洲欧美激情插| 在线观看成人网| 国产精品剧情在线亚洲| 国产成人综合一区| 久久品道一品道久久精品| 青青草精品视频在线| 国产成人一区二区精品非洲| 欧美少妇一区二区三区| 久久精品国产亚洲a| 一本色道久久综合亚洲二区三区| 日韩极品在线观看| 中文字幕日韩精品一区二区| 久久av资源网| av片在线免费| 91美女片黄在线观看| 欧美成人精品欧美一级乱| 国产亚洲一二三区| 超碰成人福利网| 亚洲精品一卡二卡| 亚洲精品套图| 91精品午夜视频| 高清毛片在线观看| 日韩中文字幕视频| 9国产精品午夜| 国产原创欧美精品| 亚洲经典自拍| 国产一二三四五| 国产日韩欧美综合一区| 久久.com| 4438x成人网最大色成网站| av在线中出| 久久九九免费视频| 欧美日本成人| 麻豆精品视频| 91亚洲精品乱码久久久久久蜜桃| 4虎在线播放1区| 欧美午夜电影在线播放| 亚洲天堂手机| 欧美精品第一页在线播放| 日韩黄色大片网站| 色一情一区二区三区四区| av网站一区二区三区| av777777| 日韩视频在线永久播放| 经典三级一区二区| 国产精品久久精品| 日韩中文字幕不卡| 国产区二区三区| 欧美视频精品在线| 久久久久伊人| 51国偷自产一区二区三区的来源| 美女视频黄免费的久久| 在线视频xx| 精品嫩草影院久久| 偷窥自拍亚洲色图精选| 欧美日韩亚洲一区二区三区在线观看| 91在线观看下载| 极品白浆推特女神在线观看 | 精品一区二区三区中文字幕在线 | 影音先锋中文字幕一区| 中文字幕欧美日韩一区二区| 亚洲欧洲日韩综合一区二区| 秋霞午夜理伦电影在线观看| 欧美成人精品一区二区| 国产精品久久777777毛茸茸| 日韩av片网站| 欧美xxx久久| 日韩精品诱惑一区?区三区| 亚洲一区二区在| 欧美日韩国产一区在线| 在线免费观看亚洲| 日韩av高清| 懂色aⅴ精品一区二区三区蜜月 | 欧美日韩亚洲系列| 99精品视频在线免费播放 | 国产成人涩涩涩视频在线观看| 裸体素人女欧美日韩| metart日本精品嫩模| 国产丝袜精品视频| 欧美a级片网站| 久久久久久久久久福利| 精品区一区二区| 一区二区三区午夜探花| 国产免费999| 亚洲系列中文字幕| 先锋影音国产一区| fc2人成共享视频在线观看| 中文字幕亚洲国产| 久热综合在线亚洲精品| 亚洲一区二区三区精品中文字幕 | 一级性生活视频| 在线观看一区日韩| 香蕉久久99| 97xxxxx| 亚洲欧美www| 国产精品久久久久久久免费软件| 91精品久久久久久9s密挑| 色综合五月天导航| 成人午夜免费av| 成人国产二区| 99精品视频网站| 欧美sm美女调教| 亚洲欧美日韩在线观看a三区| 中文天堂在线观看| 57pao国产成人免费| 久久久亚洲精品一区二区三区| 美女福利一区二区| 7777在线视频| 亚洲欧美国产精品久久久久久久| 日韩专区一卡二卡| 免费黄色在线| 欧美日韩免费精品| 日韩三级高清在线| 日韩avvvv在线播放| 亚洲淫性视频| 性欧美videosex高清少妇| 欧美一区二区久久| 老司机午夜精品视频在线观看| 求av网址在线观看| 奇米视频888战线精品播放| 91精品国产91久久综合桃花 | 91国产在线精品| 国产丝袜欧美中文另类| 日韩一级淫片| 免费男女羞羞的视频网站中文版| 久久免费国产精品1| 亚洲婷婷综合久久一本伊一区| 九九热播视频在线精品6| 色综合天天色综合| 日韩av手机在线看| 亚洲国产精品久久人人爱| 成人免费看片39| 国产系列电影在线播放网址| 国精产品一区二区| 日韩欧美激情一区| 奇米色一区二区三区四区| 日本成人不卡| 18禁裸男晨勃露j毛免费观看| 最近的2019中文字幕免费一页 | 波多野结衣中文一区| 亚洲精品毛片| 91骚色在线| 91福利视频导航| 日韩免费一区二区三区在线播放| 奇米一区二区三区| 国产亚洲一区二区手机在线观看| 欧美三级一级片| 人九九综合九九宗合| 欧美日韩一区免费| 日产国产欧美视频一区精品| 8av国产精品爽爽ⅴa在线观看| 国产l精品国产亚洲区久久| 91精品国产沙发| 欧美午夜精品一区| 亚洲国产成人爱av在线播放| 精品亚洲国产成人av制服丝袜| 成人在线观看免费播放| 五月天电影免费在线观看一区| 91免费版网站入口| 亚洲国产高清福利视频| 国产精品拍天天在线| 欧美日韩岛国| 国产精品无码久久久久| 波多野结衣在线中文|