馬斯克發(fā)布機器人,“鋼鐵俠”那種!特斯拉推出全球超快AI計算機
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
全球最快的AI訓(xùn)練速度王座,剛剛易主了。
不是英偉達GPU,也不是谷歌TPU……
馬斯克治下的特斯拉,自研AI訓(xùn)練芯片D1,自研AI超級計算機Dojo ExaPod,首秀即巔峰,登場就是全球第一。
此外,馬斯克還帶來了另一個特斯拉新品:
汽車機器人,搭載了特斯拉包含芯片在內(nèi)的軟硬件系統(tǒng),但跟百度的不同,不像汽車更像人。
這就是特斯拉年度AI開放日上,馬斯克再次帶來的一系列激動人心的大進展。
特斯拉自研AI訓(xùn)練芯片D1發(fā)布
馬斯克說:要有一個超快的計算機來訓(xùn)練Autopilot在內(nèi)的整個自動駕駛系統(tǒng)。
于是DOJO誕生了。
DOJO,取名源自日語里“練武”專用的道場,顧名思義,DOJO就是特斯拉AI不斷精益功夫的道場。
DOJO 是一種通過網(wǎng)絡(luò)結(jié)構(gòu)連接的分布式計算架構(gòu)。它還具有大型計算平面、極高帶寬和低延遲,以及分區(qū)和映射的大型網(wǎng)絡(luò)。

實際上,在CVPR 2021現(xiàn)場,特斯拉就已經(jīng)劇透過DOJO的相關(guān)性能。
當(dāng)時總算力達1.8EFLOPS,讀寫速度高達1.6TBps,一度被認為超越全球排名第一的超級計算機富岳,創(chuàng)造超算新紀錄。
但那時DOJO用的是英偉達的A100 GPU,單卡算力321TFLOPS,共計5760張,節(jié)點數(shù)高達720個。
而現(xiàn)在,DOJO更進一步,自研了“心臟”芯片。
特斯拉首款A(yù)I訓(xùn)練芯片D1,正式發(fā)布。
7nm工藝,單片F(xiàn)P32達到算力22.6TOPs,BF16算力362TOPs。

特斯拉發(fā)布會現(xiàn)場,還用圖展示性能,拳打英偉達GPU,腳踢谷歌TPU。

一句話概括,比現(xiàn)在市面上任何芯片都強。
特斯拉也用“Pure Learning Machine”,純學(xué)習(xí)機器,來稱呼D1芯片。
此外,D1芯片強的不只是單兵作戰(zhàn)能力,還有集團軍作戰(zhàn)能力,它們可以無縫融合,變成超大規(guī)模計算陣列。

能有多大,接下來,特斯拉就揭曉了之前預(yù)熱海報上的“神秘物種”:

集合了25塊D1芯片的訓(xùn)練模塊!
這也是特斯拉首個訓(xùn)練模塊,而把多個模塊集合,就能形成更大算力的訓(xùn)練陣列:

至此,特斯拉自研超算DOJO完整真身亮相!
超過50萬個訓(xùn)練節(jié)點。每個模塊算力為9 petaflops,帶寬為36TB/s。
DOJO的可怕之處在于,不同于世界其他超算需要承擔(dān)多種不同任務(wù),DOJO的唯一使命就是AI訓(xùn)練,或者可以說聚焦到自動駕駛算法的訓(xùn)練。
因為專注,所以首秀即巔峰。
AutoPilot、FSD,特斯拉的其他AI訓(xùn)練任務(wù),都能在DOJO里更高效練就。
另外,特斯拉官方還繼續(xù)劇透:這不是終點,下一代DOJO還會有10倍性能的提升!

所以到這里就完了?拿衣服。
最后也是最強,特斯拉D1支持下的終極大殺器登場:
ExaPOD,集成120個訓(xùn)練模塊,包含3000個D1芯片,超過1百萬個訓(xùn)練節(jié)點。算力達到1.1EFLOP。

而且每單位能耗下的性能比當(dāng)今最強超算高1.3倍,但碳排放僅為1/5。
速度和性能,冠絕業(yè)內(nèi)。
于是特斯拉明確:這就是全球最快的AI訓(xùn)練計算機。
有意思的是,2019年美國能源部曾放言要花6億美元建E級算力的超算,2023年問世……
萬萬沒想到,這個目標(biāo)被“車企”特斯拉率先實現(xiàn)了。

最強“煉丹爐”為誰而建?
所以問題來了,自研D1芯片有了,最強AI訓(xùn)練超算DOJO ready了,接下來特斯拉會有怎樣的改變?
特斯拉AI技術(shù)主管Andrej Karpathy(李飛飛高徒)登場,介紹了D1芯片和DOJO,主要服務(wù)的對象——特斯拉的在自動駕駛方面領(lǐng)先所有對手的“靈丹妙藥”:
純視覺方案。
事故頻出,爭議四起,甚至中國絕大部分玩家都轉(zhuǎn)向了視覺+激光雷達的綜合方案,但特斯拉依然堅持。
Karpathy詳細介紹了特斯拉高純視覺方案的思路,和現(xiàn)行8攝像頭方案的特點,以及它為什么能work。
特斯拉純視覺方案,基本構(gòu)建原則是把自動駕駛系統(tǒng)看作一個生物,有眼睛、有神經(jīng)、有大腦。

目前的方案有八個攝像頭,背后是被稱為HydraNets——“九頭蛇網(wǎng)絡(luò)”的多任務(wù)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
“九頭蛇網(wǎng)絡(luò)”可以同時處理目標(biāo)檢測、交通標(biāo)志識別、車道預(yù)測等等任務(wù),其關(guān)鍵在于對各種數(shù)據(jù)的特征提取,包括不同種類數(shù)據(jù)的特征共享、對不同任務(wù)的分別調(diào)參,以及參數(shù)緩存,用來加快調(diào)參速度。

這也是實現(xiàn)FSD敏捷開發(fā),半年內(nèi)迭代2-3個版本的關(guān)鍵。
接下來,Karpathy 描述了純視覺方案的歷史,以及方案發(fā)展到今天的邏輯,他展示了一段特斯拉處理其圖像數(shù)據(jù)的視頻。
他說過去 的FSD 雖然很好,但事實證明這樣的系統(tǒng)不夠完善,每個攝像頭能夠檢測到工程師預(yù)期的目標(biāo),但背后神經(jīng)網(wǎng)絡(luò)的矢量空間是不夠的。
于是,特斯拉如重新設(shè)計了神經(jīng)網(wǎng)絡(luò),就是上面的“九頭蛇”。
另外相機校準、緩存、隊列和優(yōu)化等等環(huán)節(jié)都做了最大程度簡化。

特斯拉方面還比較了多攝像頭方案和單攝像頭方案的差別,相同的場景下,單攝像頭方案識別率明顯低于多攝像頭方案。
特斯拉車輛上的8個攝像頭獲取原始輸入后,系統(tǒng)會創(chuàng)建各種分辨率的圖像,用于各種功能和目的。
這些不同的圖像會被分別喂給處理不同任務(wù)的神經(jīng)網(wǎng)絡(luò),作為整個自動駕駛系統(tǒng)的決策依據(jù)。

接著,Karpathy介紹了特斯拉的“終極建筑師”,即車輛在行駛過程中可以實時對車道、環(huán)境建模。
車道線實時建模,其實就是特斯拉自己的高精地圖能力。
中國自動駕駛玩家,強調(diào)“高精度地圖”的不少,但特斯拉的思路,“現(xiàn)成資源”不是本質(zhì)能力,本質(zhì)能力應(yīng)該是“創(chuàng)造資源”的能力。
最后,Karpathy談了AI公司常見的數(shù)據(jù)標(biāo)注問題,他認為,把數(shù)據(jù)外包給第三方去做手工標(biāo)注并不好,所以特斯拉選擇自建團隊來給數(shù)據(jù)打標(biāo),目前已經(jīng)從2D圖像標(biāo)記升級到4D矢量空間的標(biāo)記。

這也是特斯拉自動駕駛不斷快速進化的核心所在。
依靠人工標(biāo)注,顯然無法應(yīng)對量產(chǎn)車上路后的大規(guī)模數(shù)據(jù),所以只有自動化標(biāo)注,才能形成數(shù)據(jù)閉環(huán)。
開放日上,特斯拉也展示了如何從車道線、2D圖像……一點點躍遷至4D標(biāo)注和建模的。
行人、車輛、樹木,建筑物……清清楚楚,而且還有意圖識別。
特斯拉方面也強調(diào),基于類腦一樣的感知系統(tǒng)、自動化標(biāo)注能力,以及仿真,確保了特斯拉為什么可以基于純視覺實現(xiàn)更高維度的自動駕駛。
仿真,簡單講就是利用現(xiàn)實數(shù)據(jù),將真實世界的實時動態(tài)景象,在計算機系統(tǒng)實現(xiàn)重新構(gòu)建和重現(xiàn)。
這套模擬程序,用特斯拉的話說,就是一個以自動駕駛為玩家的視頻游戲。
在這套系統(tǒng)里,任何要素都可以被添加其中,包括奇葩的極端場景。
比如這里,人太多導(dǎo)致目標(biāo)難以標(biāo)注,車輛極多:
特斯拉這里還不忘補刀一下毫米波雷達——純視覺也能做很好,所謂的雷達冗余作用有限。
特斯拉方面還披露,現(xiàn)在標(biāo)注和仿真系統(tǒng),可以模擬數(shù)量高達3.71億的數(shù)據(jù)及場景。

當(dāng)然,自動駕駛最后還得解決從比特世界走向原子世界應(yīng)用的問題。
這次特斯拉主要披露了控制和規(guī)劃方面的進展。
特斯拉自動駕駛總監(jiān)Ashok Elluswamy,分享了特斯拉針對復(fù)雜場景的規(guī)劃方案——“混合規(guī)劃系統(tǒng)”。
主要思路和技術(shù)方法是基于蒙特卡洛樹搜索,實現(xiàn)最佳路徑規(guī)劃。
最后,整個特斯拉自動駕駛從感知到?jīng)Q策規(guī)劃,一圖概括如下:

One more thing:特斯拉“機器人”
最后的最后,就在大家都以為發(fā)布會完全就是自動駕駛相關(guān)內(nèi)容之際……
“簡短茶歇”環(huán)節(jié),竟然來了一段“機器人熱舞”——宛如衣服Model一樣的穿著,樣子非常“硅基”。
這是特斯拉的行為藝術(shù)?
不不不,再次出乎意料。
馬斯克再次登臺,然后鄭重其事發(fā)布:特斯拉機器人。
身高5英尺8英寸,約為172cm;重量125磅,約為56.7kg;承載能力為45磅,約為20kg。

它的面部是一個顯示屏,用來顯示重要信息。
從外形上看,四肢和人類一樣。
為了實現(xiàn)平衡性和敏捷性,四肢使用了40個機電推桿。

同時,特斯拉各項AI和芯片技術(shù),都會應(yīng)用其中。
比如使用Autopilot的攝像頭充當(dāng)感知系統(tǒng),胸腔里內(nèi)置特斯拉自研芯片——FSD同款,還會加持多項特斯拉已開發(fā)出的技術(shù),如多攝像頭視頻神經(jīng)網(wǎng)絡(luò)、規(guī)劃能力、標(biāo)記。

而且馬斯克強調(diào),這不是玩具周邊,它會最終實現(xiàn)——可能明年就會正式推出,這是特斯拉電動車的下一步。
硅谷鋼鐵俠還說,他會是一個非常有用的機器人,由人打造,為人服務(wù),而且會確保一直對人友好,能把人從危險的、重復(fù)的,無聊的任務(wù)中解放出來。
甚至還能跟已經(jīng)高度自動化的特斯拉車輛生產(chǎn)進一步結(jié)合協(xié)作。但按照馬斯克的意思,首要的應(yīng)該是“做家務(wù)”。
有意思的是,隨著特斯拉這個“機器人”發(fā)布,太平洋兩岸都把“機器人”作為了智能車變革的下一步。
中國這邊,百度李彥宏剛剛推出了一款“汽車機器人”,不過更像“汽車”而不是“人”。
美國那頭,馬斯克的特斯拉機器人,更像“人”而不是“汽車”。
這種區(qū)別,也可能跟馬斯克的那個江湖綽號有關(guān)。
伊隆·馬斯克,不就是現(xiàn)實版鋼鐵俠嗎?









































