技術(shù)
導(dǎo)讀:該超級(jí)計(jì)算機(jī)用于訓(xùn)練為特斯拉Autopilot和即將問世的自動(dòng)駕駛AI,提供動(dòng)力的神經(jīng)網(wǎng)絡(luò)。
據(jù)媒體報(bào)道,近日,特斯拉推出了新的超級(jí)計(jì)算機(jī),據(jù)稱是全球第五大超級(jí)計(jì)算機(jī),也是特斯拉即將推出的新超級(jí)計(jì)算機(jī)Dojo的“先行版本”。
該超級(jí)計(jì)算機(jī)用于訓(xùn)練為特斯拉Autopilot和即將問世的自動(dòng)駕駛AI,提供動(dòng)力的神經(jīng)網(wǎng)絡(luò)。
在過去幾年中,特斯拉一直將重點(diǎn)放在汽車內(nèi)外部的計(jì)算能力上。在內(nèi)部,運(yùn)行自動(dòng)駕駛軟件需要足夠強(qiáng)大的計(jì)算機(jī)能力,在外部,需要超級(jí)計(jì)算機(jī)訓(xùn)練由神經(jīng)網(wǎng)絡(luò)支持的自動(dòng)駕駛軟件,這些神經(jīng)網(wǎng)絡(luò)會(huì)接收來自車隊(duì)的大量數(shù)據(jù)。
特斯拉的Dojo項(xiàng)目由計(jì)算速度達(dá)每秒百萬萬億次(exaFLOP)的超級(jí)計(jì)算機(jī)組成,使其成為全球最強(qiáng)大的計(jì)算機(jī)之一。
此前,特斯拉一直在研究Dojo,特斯拉首席執(zhí)行官埃隆·馬斯克(Elon Musk)曾暗示Dojo應(yīng)于今年年底準(zhǔn)備好。
日前,在2021年計(jì)算機(jī)視覺與模式識(shí)別大會(huì)上,特斯拉AI主管Andrej Karpath介紹了該公司的最新超級(jí)計(jì)算機(jī)。
Karpathy展示了特斯拉的第三個(gè)超級(jí)計(jì)算機(jī)集群,特斯拉聲稱該新集群具有一些相當(dāng)瘋狂的參數(shù),應(yīng)該會(huì)使其成為全球第五的計(jì)算機(jī):
720個(gè)80GB 8x A100 節(jié)點(diǎn)(共5760 個(gè)GPU);
1.8 EFLOPS(720節(jié)點(diǎn)* 312 TFLOPS-FP16-A100 * 8 gpu/節(jié)點(diǎn));
10 PB“熱層”NVME存儲(chǔ)@ 1.6 TBps;
總交換容量為640 Tbps。
Karpathy表示,“我們有一個(gè)神經(jīng)網(wǎng)絡(luò)架構(gòu)網(wǎng)絡(luò)和一個(gè)1.5 pb的數(shù)據(jù)集,需要大量的計(jì)算。
對(duì)我們而言,計(jì)算機(jī)視覺是使自動(dòng)駕駛成為可能的基本要素。為了讓其更好地工作,我們需要掌握來自車隊(duì)的數(shù)據(jù),訓(xùn)練大量的神經(jīng)網(wǎng)絡(luò),并進(jìn)行大量實(shí)驗(yàn),因此,我們?cè)谟?jì)算上投入了很多。
在本例中,我們展示的是使用720個(gè)80GB版本的8x A100節(jié)點(diǎn)構(gòu)建的集群。
這是一臺(tái)巨大的超級(jí)計(jì)算機(jī),就每秒浮點(diǎn)運(yùn)算次數(shù)而言,我認(rèn)為它可能是全球第五的超級(jí)計(jì)算機(jī)。”
Karpathy不愿詳細(xì)介紹Dojo項(xiàng)目,但他表示,與特斯拉目前的集群相比,Dojo將是一臺(tái)更適合神經(jīng)網(wǎng)絡(luò)訓(xùn)練的超級(jí)計(jì)算機(jī)。
馬斯克此前還表示,特斯拉計(jì)劃最終將其超級(jí)計(jì)算機(jī)提供給其他公司,以便這些公司訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò)。