應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個人注冊登錄

晶圓級新芯片會引領(lǐng)一個新時代嗎?

2020-11-25 09:32 半導(dǎo)體行業(yè)觀察

導(dǎo)讀:?計算機(jī)芯片的歷史是是一段激動人心的微型化的歷史。

眾所周知,數(shù)字世界催生了一種趨勢,規(guī)模越小越好。那么,為什么在地球上有些人想逆轉(zhuǎn)航向,并使用大芯片呢?當(dāng)然,我們沒有特別充分的理由在一個iPad中用一個iPad大小的芯片,不過這樣的大芯片可能被證明是具有更具體的用途,如人工智能和物理世界的模擬。

至少,這就是世界上最大的計算機(jī)芯片制造商Cerebras所希望的。

Cerebras晶圓級引擎無論以何種方式進(jìn)行切割都非常龐大。該芯片的是8.5英寸,并裝有1.2萬億個晶體管。而排名第二大的芯片是NVIDIA的GPUA100,只有一英寸,晶體管數(shù)量也只有540億個。前者是新的芯片類型,基本上未經(jīng)測試,到目前為止,他們推出的芯片也是唯一的一款。后者廣受喜愛,已大量生產(chǎn),并在過去十年中接管了AI和超級計算的世界。

新芯片會引領(lǐng)一個新時代嗎?讓我們來細(xì)看一下。

超越人工智能的大芯片

去年,當(dāng) Cerebras的芯片首次脫穎而出時 ,該公司表示其將大大加快深度學(xué)習(xí)模型的訓(xùn)練速度。

從那時起,WSE進(jìn)入了少數(shù)超級計算實(shí)驗(yàn)室,該公司的客戶正在不斷努力。其中一個實(shí)驗(yàn)室,即國家能源技術(shù)實(shí)驗(yàn)室,正在尋找它在人工智能之外還能做什么。

因此,在最近的一項試驗(yàn)中,研究人員將芯片與流體動力學(xué)模擬中的超級計算機(jī)相提并論,該芯片位于一個稱為CS-1的一體式系統(tǒng)中。模擬流體的運(yùn)動是一種通用的超級計算機(jī)應(yīng)用程序,可用于解決諸如天氣預(yù)報和飛機(jī)機(jī)翼設(shè)計之類的復(fù)雜問題。

該試驗(yàn)由Cerebras的Michael James和NETL的Dirk Van Essendelft領(lǐng)導(dǎo)的團(tuán)隊進(jìn)行,在他們撰寫的預(yù)印本論文作了描述,并在本周的 SC20 超級計算會議上發(fā)表。研究小組說,CS-1完成了電廠的燃燒模擬,任務(wù)的速度比Joule 2.0超級計算機(jī)快200倍。

CS-1實(shí)際上比實(shí)時更快。正如 Cerebrus在博客文章中寫道: “它可以告訴您未來將發(fā)生什么,而物理定律不會產(chǎn)生相同的結(jié)果?!?/p>

研究人員說,CS-1的性能是任何數(shù)量的CPU和GPU都無法比擬的。該公告首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Andrew Feldman 告訴 VentureBeat ,“無論超級計算機(jī)有多大,該理論都是正確的”。在某種程度上,對像Joule這樣的超級計算機(jī)進(jìn)行擴(kuò)展在這種問題上不再產(chǎn)生更好的結(jié)果。因此, Joule的仿真速度達(dá)到 了16,384個內(nèi)核的 峰值 ,但這只是其全部86,400個內(nèi)核的一小部分。

通過 對兩臺機(jī)器的比較,可以得出 結(jié)論。Jouel是世界上第 81快的超級計算機(jī) ,占用數(shù)十個服務(wù)器機(jī)架,消耗高達(dá)450千瓦的功耗,并且需要數(shù)千萬美元的建造費(fèi)用。相比之下,CS-1安裝在服務(wù)器機(jī)架的三分之一中,消耗20千瓦的功耗,售價僅為幾百萬美元。

盡管這項任務(wù)非常小巧(但很有用),而且問題非常適合CS-1,但它仍然是一個非常驚人的結(jié)果。那他們怎么做到的呢?這t全部都體現(xiàn)在設(shè)計中。

減少通信

計算機(jī)芯片的生命始于一個稱為晶圓的大硅片上。將多個芯片蝕刻到同一晶圓上,然后將晶圓切割成單個芯片。當(dāng)WSE也被蝕刻到硅晶圓上時,該晶圓將作為一個單獨(dú)的操作單元完整保留。該晶圓級芯片包含近40萬個處理核心。每個內(nèi)核都連接到其自己的專用存儲器及其四個相鄰內(nèi)核。

將這么多內(nèi)核放在一個芯片上并為其提供自己的內(nèi)存是WSE能做到這么大的原因。這也是為什么在這種情況下,芯片表現(xiàn)更好的原因。

大多數(shù)大型計算任務(wù)都依賴于大規(guī)模并行處理。研究人員在數(shù)百或數(shù)千個芯片中分配任務(wù)。這些芯片需要協(xié)同工作,因此它們之間保持著不斷的通信,來回傳遞信息。當(dāng)信息在進(jìn)行計算的處理器內(nèi)核和共享內(nèi)存之間存儲信息時,每個芯片內(nèi)部都會發(fā)生類似的過程。

這是一個d帶點(diǎn)兒懷餓舊公司,在紙上做它的所有業(yè)務(wù)。

該公司使用快遞公司從鎮(zhèn)上其他分支機(jī)構(gòu)和檔案中發(fā)送和收集文檔??爝f員知道穿過城市的最佳路線,但行程只需要最少的時間,具體取決于分支機(jī)構(gòu)和檔案館之間的距離,快遞員的最高速度以及路上有多少其他快遞員。簡而言之,距離和交通會減慢速度。

現(xiàn)在,想象一下公司正在建造一座嶄新的閃亮摩天大樓。每個分支機(jī)構(gòu)都搬進(jìn)了新大樓,每個工人在辦公室里都有一個小的文件柜來存儲文件?,F(xiàn)在,他們需要的任何文檔都可以在跨辦公室或穿過大廳到達(dá)鄰居辦公室所需的時間進(jìn)行存儲和檢索。信息通信幾乎消失了,因?yàn)橐磺卸荚谕粋€房子里。

Cerebras的巨型芯片有點(diǎn)像那座摩天大樓。與需要聯(lián)網(wǎng)大量傳統(tǒng)芯片的傳統(tǒng)超級計算機(jī)相比,它傳遞信息的方式(通過其專門定制的編譯軟件進(jìn)一步輔助)更加高效。

模擬世界的發(fā)展

值得注意的是,該芯片只能處理足夠小的問題以適合晶圓。但是,由于機(jī)器能夠?qū)崟r進(jìn)行高保真模擬,因此此類問題可能具有相當(dāng)實(shí)際的應(yīng)用。作者指出,該機(jī)器在理論上應(yīng)該能夠準(zhǔn)確地模擬試圖降落在駕駛艙上的直升機(jī)周圍的氣流,并使該過程半自動化-這是傳統(tǒng)芯片無法做到的。

他們指出,另一個機(jī)會是使用模擬作為輸入來訓(xùn)練也駐留在芯片上的神經(jīng)網(wǎng)絡(luò)。在一個引人入勝的相關(guān)示例中,最近 證明 ,加州理工學(xué)院的機(jī)器學(xué)習(xí)技術(shù)在求解相同種類的偏微分方程以模擬流體動力學(xué)時, 速度快 了 1000倍 。

他們還指出,芯片的改進(jìn)(以及其他類似的產(chǎn)品,如果有的話)將可完成工作的極限繼續(xù)往前推進(jìn)。Cerebras已經(jīng)搶先 發(fā)布了其下一代芯片 ,該 芯片 將具有2.6萬億個晶體管,850,00個內(nèi)核以及兩倍以上的內(nèi)存。

當(dāng)然, 晶圓級計算 是否 真正起飛 還有待觀察。這個想法已經(jīng)存在了幾十年,但是Cerebras是第一個認(rèn)真追求它的人。顯然,他們相信他們已經(jīng)以一種有用且經(jīng)濟(jì)的方式解決了這個問題。

其他新架構(gòu)也正在實(shí)驗(yàn)室中進(jìn)行研究。例如, 基于憶阻器的神經(jīng)形態(tài)芯片 通過將處理和記憶放入單個類似晶體管的組件中來模仿大腦。當(dāng)然,量子計算機(jī)位于單獨(dú)的通道中,但是可以解決類似的問題。

可能其中一種技術(shù)最終興起來統(tǒng)治所有這些技術(shù)?;蛘?,這似乎很有可能,計算可能會分裂成一堆怪異的基本芯片,根據(jù)情況將它們?nèi)糠庋b在一起以充分利用每個芯片。