国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

特斯拉Dojo超算架構(gòu)細(xì)節(jié)首次公開!為自動(dòng)駕駛「操碎了芯」

人工智能 新聞
在剛剛舉辦的硅谷芯片技術(shù)研討會(huì)Hot Chips 34會(huì)議上,備受關(guān)注的特斯拉Dojo超算指令集結(jié)構(gòu)細(xì)節(jié)史上首次被公開。

為了滿足對(duì)人工智能和機(jī)器學(xué)習(xí)模型越來越大的需求, 特斯拉創(chuàng)建了自己的人工智能技術(shù),來教特斯拉的汽車自動(dòng)駕駛。

最近,特斯拉在Hot Chips 34會(huì)議上,披露了大量關(guān)于Dojo(道場(chǎng))超級(jí)計(jì)算架構(gòu)的細(xì)節(jié)。

本質(zhì)上,Dojo是一個(gè)巨大的可組合的超級(jí)計(jì)算機(jī),它由一個(gè)完全定制的架構(gòu)構(gòu)建,涵蓋了計(jì)算、網(wǎng)絡(luò)、輸入/輸出(I/O)芯片到指令集架構(gòu)(ISA)、電源傳輸、包裝和冷卻。所有這些都是為了大規(guī)模地運(yùn)行定制的、特定的機(jī)器學(xué)習(xí)訓(xùn)練算法。

Ganesh Venkataramanan是Tesla自動(dòng)駕駛硬件高級(jí)總監(jiān),負(fù)責(zé)Dojo項(xiàng)目,以及AMD的CPU設(shè)計(jì)團(tuán)隊(duì)。Hot Chips 34會(huì)議上,他和眾位芯片、系統(tǒng)和軟件工程師首次公開了該機(jī)器的許多架構(gòu)特性。

數(shù)據(jù)中心「三明治」

「 一般來說,我們制造芯片的過程,是把它們放在包裝上,把包裝放在印刷電路板上,然后進(jìn)入系統(tǒng)。系統(tǒng)進(jìn)入機(jī)架。」Venkataramanan說。

但是這個(gè)過程中存在一個(gè)問題:每次數(shù)據(jù)從芯片移動(dòng)到封裝上并離開封裝時(shí),都會(huì)產(chǎn)生延遲和帶寬損失。

為了繞過這些限制,Venkataramanan和他的團(tuán)隊(duì)決定從頭開始。

圖片

由此,Dojo的訓(xùn)練瓦片誕生了。

這是一個(gè)獨(dú)立的計(jì)算集群,占地半立方英尺,在15千瓦的液冷封裝中能夠達(dá)到556TFLOPS的FP32性能。

每個(gè)瓦片都配備了11GB的SRAM,并在整個(gè)堆棧中使用定制的傳輸協(xié)議,通過9TB/s結(jié)構(gòu)連接。

Venkataramanan說:「這塊訓(xùn)練板代表了從計(jì)算機(jī)到存儲(chǔ)器、到電源傳輸、到通信的無與倫比的集成度,不需要任何額外的開關(guān)。」

訓(xùn)練瓦片的核心是特斯拉的D1,這是一個(gè)500億個(gè)晶體管芯片,基于臺(tái)積電的7納米工藝。特斯拉表示,每個(gè)D1能夠在400W的TDP下實(shí)現(xiàn)22TFLOPS的FP32性能。

圖片

特斯拉然后用25個(gè)D1,把它們分到已知的好模具上,然后用臺(tái)積電的晶圓上系統(tǒng)技術(shù)把它們包裝起來,以極低的延遲和極高的帶寬實(shí)現(xiàn)大量的計(jì)算集成。

然而,晶片上的系統(tǒng)設(shè)計(jì)和垂直堆疊架構(gòu),給電力輸送帶來了挑戰(zhàn)。

據(jù)Venkataramanan說,目前大多數(shù)加速器將電源直接放在硅片旁邊。他解釋說,這種方法雖然行之有效,但這就意味著加速器的很大一部分區(qū)域必須專門用于這些組件,這對(duì)Dojo來說是不切實(shí)際的。于是,特斯拉選擇直接通過芯片底部直接提供電源。

此外,特斯拉還開發(fā)了Dojo接口處理器(DIP),它是主機(jī)CPU和訓(xùn)練處理器之間的橋梁。

每個(gè)DIP都有32GB的HBM,最多可以將五個(gè)這樣的卡以900GB/s的速度連接到一個(gè)訓(xùn)練瓦片上,以達(dá)到4.5TB/s的總量,每個(gè)瓦片共有160GB的HBM。

圖片

特斯拉的V1配置成對(duì)的這些瓦片——或150個(gè)D1模具——在陣列中支持四個(gè)主機(jī)CPU,每個(gè)主機(jī)CPU配備五個(gè)DIP卡,以實(shí)現(xiàn)聲稱的BF16或CFP8性能的exaflop。

圖片

軟件

這樣一個(gè)專門的計(jì)算架構(gòu),就需要一個(gè)專門的軟件棧。然而,Venkataramanan和他的團(tuán)隊(duì)認(rèn)識(shí)到,可編程性將決定Dojo的成敗。

「當(dāng)我們?cè)O(shè)計(jì)這些系統(tǒng)時(shí),軟件同行的易編程性是最重要的。研究人員不會(huì)等待你的軟件人員為適應(yīng)我們想要運(yùn)行的新算法而寫一個(gè)手寫的內(nèi)核。」

為了做到這一點(diǎn),特斯拉放棄了使用內(nèi)核的想法,圍繞編譯器設(shè)計(jì)了Dojo的架構(gòu)。

「我們的做法是使用PiTorch。我們創(chuàng)建了一個(gè)中間層,它幫助我們并行化,以擴(kuò)展其下面的硬件。所有東西下面都是編譯過的代碼。」為了創(chuàng)建可適應(yīng)任何未來工作負(fù)載的軟件堆棧,這是唯一的方法。

盡管強(qiáng)調(diào)了軟件的靈活性,Venkataramanan指出,目前在他們的實(shí)驗(yàn)室中運(yùn)行的平臺(tái),暫時(shí)僅限于特斯拉使用。

Dojo架構(gòu)一覽

看完了以上這些,讓我們深入了解一下Dojo的架構(gòu)。

特斯拉擁有用于機(jī)器學(xué)習(xí)的百億億次人工智能級(jí)系統(tǒng)。特斯拉有足夠的資金規(guī)模來雇傭員工,并專門為其應(yīng)用構(gòu)建芯片和系統(tǒng),就像特斯拉的車載系統(tǒng)一樣。

圖片

特斯拉不僅在構(gòu)建自己的AI芯片,還在構(gòu)建超級(jí)計(jì)算機(jī)。

圖片

分布式系統(tǒng)分析

Dojo的每個(gè)節(jié)點(diǎn)都有自己的CPU、內(nèi)存和通信接口。

圖片

Dojo節(jié)點(diǎn)

這是Dojo處理器的處理管線。

圖片

處理管道

每個(gè)節(jié)點(diǎn)有1.25MB的SRAM。在AI訓(xùn)練和推理芯片中,一種常見的技術(shù)是將內(nèi)存與計(jì)算共置,以最大限度地減少數(shù)據(jù)傳輸,因?yàn)閺墓β屎托阅艿慕嵌葋砜矗瑪?shù)據(jù)傳輸非常昂貴。

圖片

節(jié)點(diǎn)內(nèi)存

然后每個(gè)節(jié)點(diǎn)都連接到一個(gè)2D網(wǎng)格。

圖片

網(wǎng)絡(luò)接口

這是數(shù)據(jù)路徑概述。

圖片

數(shù)據(jù)路徑

下面是一個(gè)例子,說明芯片可以做的列表解析。

圖片

列表解析

這里有更多關(guān)于指令集的內(nèi)容,屬于特斯拉原創(chuàng),而不是典型的Intel、Arm、NVIDIA或AMD CPU/GPU的指令集。

圖片

指令集

在人工智能中,算術(shù)格式很重要,尤其是芯片支持哪些格式。利用DOJO,特斯拉就可以研究常用格式,例如FP32、FP16和BFP16。這些是常見的行業(yè)格式。

圖片

算術(shù)格式

特斯拉也在研究可配置的FP8或CFP8。它有4/3和5/2的范圍選項(xiàng)。這類似于 NVIDIA H100 Hopper配置的FP8。我們還看到Untether.AI Boqueria 1458 RISC-V核心AI加速器專注于不同的FP8類型。

圖片

算術(shù)格式 2

Dojo還具有不同的CFP16格式,以實(shí)現(xiàn)更高的精度,并支持FP32、BFP16、CFP8和CFP16。

圖片

算術(shù)格式 3

然后將這些核心集成到制造的模具中。特斯拉的D1芯片由臺(tái)積電以7nm工藝制造。每個(gè)芯片有354個(gè)Dojo處理節(jié)點(diǎn)和440MB的SRAM。

圖片

First Integration Box D1 模具

這些D1芯片被封裝在一個(gè)道場(chǎng)訓(xùn)練瓦片上。D1芯片經(jīng)過測(cè)試,然后被組裝成一個(gè)5×5的瓦片。這些瓦片每個(gè)邊緣有4.5TB/s的帶寬。它們還具有每個(gè)模塊15kW的功率傳輸包絡(luò),或者可以說,每個(gè)D1芯片去掉40個(gè)I/O裸片所使用的功率后,大約還有600W。通過對(duì)比可以看出,如果一家公司不想設(shè)計(jì)這種東西,為什么像Lightmatter Passage會(huì)更有吸引力。

圖片

二次集成箱Dojo訓(xùn)練瓦片

Dojo的接口處理器位于2D網(wǎng)格的邊緣。每個(gè)訓(xùn)練塊有11GB的SRAM和160GB的共享DRAM。

圖片

Dojo系統(tǒng)拓?fù)?/span>

以下是連接處理節(jié)點(diǎn)的2D網(wǎng)格的帶寬數(shù)據(jù)。

圖片

Dojo系統(tǒng)通信邏輯二維網(wǎng)格

每個(gè)DIP和主機(jī)系統(tǒng)提供32GB/s的鏈接。

圖片

Dojo系統(tǒng)通信 PCIe鏈接DIP和主機(jī)

特斯拉還具有用于更長路線的Z平面鏈接。在接下來的演講中,特斯拉談到了系統(tǒng)級(jí)的創(chuàng)新。

圖片

通信機(jī)制

這里是die和tiles的延遲邊界,這就是為什么在Dojo中對(duì)它們進(jìn)行不同處理的原因。需要Z平面鏈路的原因是,長路徑很昂貴。

圖片

Dojo系統(tǒng)通信機(jī)制

任何處理節(jié)點(diǎn)都可以跨系統(tǒng)訪問數(shù)據(jù)。每個(gè)節(jié)點(diǎn)都可以將數(shù)據(jù)推送或拉取到SRAM或DRAM。

圖片

Dojo系統(tǒng)批量通信

Dojo使用平面尋址方案進(jìn)行通信。

圖片

系統(tǒng)網(wǎng)絡(luò)1

這些芯片可以在軟件中繞過錯(cuò)誤的處理節(jié)點(diǎn)。

圖片

系統(tǒng)網(wǎng)絡(luò)2

這意味著軟件必須了解系統(tǒng)拓?fù)洹?/span>

圖片

系統(tǒng)網(wǎng)絡(luò)3

Dojo不保證端到端的流量排序,因此需要在目的地對(duì)數(shù)據(jù)包進(jìn)行計(jì)數(shù)。

圖片

系統(tǒng)網(wǎng)絡(luò)4

以下是數(shù)據(jù)包如何計(jì)入系統(tǒng)同步的一部分。

圖片

系統(tǒng)同步

編譯器需要定義一個(gè)帶有節(jié)點(diǎn)的樹

圖片

系統(tǒng)同步2

特斯拉表示,一個(gè)exa-pod擁有超過100萬個(gè)CPU(或計(jì)算節(jié)點(diǎn))。這些都是大型系統(tǒng)。

圖片

總結(jié)

特斯拉專門為大規(guī)模工作而建造了Dojo。通常,初創(chuàng)公司都希望為每個(gè)系統(tǒng)構(gòu)建一個(gè)或幾個(gè)芯片的AI芯片。顯然,特斯拉專注于更大的規(guī)模。

在許多方面,特斯拉擁有一個(gè)巨大的人工智能訓(xùn)練場(chǎng)是合理的。更令人興奮的是,它不僅使用商業(yè)上可用的系統(tǒng),而且還在構(gòu)建自己的芯片和系統(tǒng)。標(biāo)量方面的一些ISA是借用RISC-V的,但矢量方面和很多架構(gòu)特斯拉都是定制的,所以這需要大量的工作。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-02-13 12:15:41

自動(dòng)駕駛算法

2018-11-29 12:49:52

自動(dòng)駕駛英偉達(dá)聯(lián)發(fā)科

2023-08-04 14:24:43

2021-12-15 10:40:53

特斯拉AI自動(dòng)駕駛

2024-01-03 15:07:10

2023-03-11 22:44:04

人工智能特斯拉

2017-03-20 07:25:18

人工智能NVIDIA自動(dòng)駕駛

2016-10-21 20:16:25

安全性自動(dòng)駕駛特斯拉

2024-08-05 08:20:00

馬斯克AI

2023-08-29 13:51:00

AI數(shù)據(jù)

2024-05-29 09:14:11

2023-06-22 19:39:12

特斯拉人工智能

2023-05-26 20:08:35

2023-11-27 10:26:59

自動(dòng)駕駛特斯拉

2022-07-14 14:54:00

特斯拉AI自動(dòng)駕駛

2022-10-27 10:18:25

自動(dòng)駕駛

2021-08-05 15:51:44

超算AI計(jì)算機(jī)

2021-11-18 09:50:35

自動(dòng)駕駛輔助駕駛人工智能

2022-07-12 09:42:10

自動(dòng)駕駛技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

精品亚洲一区二区三区| 国产精品久久久久久久久久小说 | 不卡av电影院| 午夜影院免费在线| 亚洲精品成人精品456| 黄色录像特级片| 麻豆精品久久久| 日本精品二区| 亚洲一区国产| 国产自产精品| 99人久久精品视频最新地址| 91九色露脸| 亚洲国产片色| 免费久久99精品国产自| 99国产精品视频免费观看一公开| 99久久久久国产精品免费| 日本久久黄色| 国产精品日韩在线| 91精品综合久久久久久久久久久| 国产国语videosex另类| 国产精品欧美三级在线观看| 日韩av毛片网| 日韩av专区| 亚洲a在线播放| 国产精品国码视频| 欧美日韩亚洲一区二区三区在线观看 | 亚洲大片精品免费| 欧洲精品在线视频| 中日韩免视频上线全都免费| 日本精品性网站在线观看| 久久99精品久久久久久园产越南| 久久久久久伊人| 天堂成人娱乐在线视频免费播放网站 | 久久精品视频亚洲| 99久久香蕉| 国产精品福利在线观看| 欧美91大片| 亚洲三区视频| 91在线精品一区二区三区| 国语对白在线视频| 一本色道亚洲精品aⅴ| gogogogo高清视频在线| 亚洲香蕉伊综合在人在线视看| 欧美综合影院| 91高清视频免费| 欧美精品日韩| 国产青草视频在线观看| 中文在线资源观看网站视频免费不卡| 日本福利小视频| 91精品在线一区二区| 秋霞国产精品| 欧美亚洲日本网站| 99精品国产在热久久婷婷| 在线观看成人免费| 国产精品每日更新在线播放网址 | 91蜜桃传媒精品久久久一区二区| 免费的av电影| 在线看不卡av| 欧美aaa视频| 国产精品私拍pans大尺度在线| 99在线|亚洲一区二区| 成年人看的毛片| 亚洲午夜日本在线观看| 婷婷丁香在线| 日本久久久久久久| 另类小说综合欧美亚洲| 激情综合网五月激情| 3d动漫精品啪啪| 97品白浆高清久久久久久| 国产精品久久久久久久免费大片 | 精品一区亚洲| 日韩久久不卡| 亚洲丝袜另类动漫二区| a在线免费观看| 高清在线视频日韩欧美| 亚洲欧美视频一区二区三区| 国产又大又黄又粗又爽| 欧美精品久久一区| 九色丨蝌蚪丨成人| 天天好比中文综合网| 亚洲国产欧美日韩另类综合 | 亚洲视频碰碰| 国模杨依粉嫩蝴蝶150p| 欧美精品国产精品| 香蕉久久精品日日躁夜夜躁| 大地资源第二页在线观看高清版| 亚洲国产成人av| 欧美亚洲福利| 日本一区网站| 激情六月天婷婷| 久久看片网站| 国产激情久久久| 国产乱码一区二区三区| 国产在线一区二区三区欧美| 久久久电影一区二区三区| 三级黄色的网站| 97免费视频在线播放| 自拍偷拍亚洲图片| 热re91久久精品国99热蜜臀| 热三久草你在线| 114国产精品久久免费观看| 久久亚洲影视婷婷| 污污视频在线| 99视频网站| 亚洲激情校园春色| 91麻豆精品| 异国色恋浪漫潭| 欧美一级日韩一级| 欧美区亚洲区| 在线视频色在线| 日本最新高清不卡中文字幕| 91免费精品国自产拍在线不卡| bl在线肉h视频大尺度| 精品久久久久久一区| 欧美日韩视频免费播放| 香蕉久久99| 91在线精品| 97在线日本国产| 2023国产精品自拍| 国产精品黄色片| 成人高清dvd| 亚洲国产日韩欧美在线图片| 激情视频一区| 久草福利在线| 国产成人成网站在线播放青青| 亚洲成人av电影在线| 日韩精品一卡| 黄色大秀av大片| 国产99在线|中文| 一区二区高清在线| 国产一区国产二区国产三区| 69ww免费视频播放器| 日本国产一区二区三区| 亚洲精品中文在线观看| 红桃成人av在线播放| 制服丝袜中文字幕在线观看| 国产精品吊钟奶在线| 亚洲无人区一区| 亚洲男女av一区二区| yjizz视频网站在线播放| 久久久久久高清| 亚洲精品v欧美精品v日韩精品| 国产精品538一区二区在线| 国产成人精品一区二区三区视频| 男人添女荫道口图片| 欧美大奶子在线| 亚洲精品视频免费看| 日韩精品免费一区二区在线观看| 亚洲美女电影在线| 鲁鲁狠狠狠7777一区二区| 亚洲精品久久视频| 91在线小视频| 久久免费视频66| 久蕉在线视频| 亚洲制服中文| 欧美理论片在线观看| 亚洲激情男女视频| 在线播放日韩| 韩国成人二区| 男女污污的视频| 成人国产精品一区| 欧美不卡激情三级在线观看| 成人性色生活片| 玖玖玖免费嫩草在线影院一区| 性网站在线看| 亚洲永久激情精品| 久久久亚洲影院你懂的| 欧美性生交大片免网| 精品中文字幕一区二区小辣椒| 韩国三级成人在线| 色视频在线观看免费| 一本一道久久久a久久久精品91 | 欧美日韩国产探花| 秋霞伦理一区| 成人性生交免费看| 国产乱码精品一区二区三区卡| 日韩精品免费在线视频观看| 国产精品美女一区二区在线观看| 欧美三级网页| 久久不卡日韩美女| 噜噜噜在线观看播放视频| 老司机午夜网站| 国产激情视频一区| 日韩av网站电影| 国产精品视频九色porn| 国产一区激情| 亚洲美女色播| 日本美女在线中文版| 最新中文字幕2018| 四虎一区二区| 国产精彩精品视频| 国产亚洲精品美女久久久久| 欧美午夜丰满在线18影院| 成人精品视频一区二区三区 | 国产成人亚洲综合91| 亚洲精品久久在线| 亚洲二区在线视频| 国产91精品露脸国语对白| 永久亚洲成a人片777777| 亚洲网站免费|