技術(shù)
導(dǎo)讀:3D V-Cache 是 AMD 開(kāi)發(fā)的一項(xiàng)新技術(shù),可以讓 L3 緩存垂直堆疊,這樣可以在占用很少空間的情況下顯著增加緩存的大小。
近日,科技評(píng)論網(wǎng)站Chips and Cheese發(fā)布了 AMD 新3D V-Cache技術(shù)的評(píng)論,展示了其與前幾代 Zen 處理器相比的性能。Chips and Cheese 選擇了 AMD 的 EPYC(霄龍)服務(wù)器處理器來(lái)?yè)?dān)任這個(gè)角色,包括支持 3D V-Cache 的 EPYC 7V73(Milan-X)和 vanilla Zen 3 EPYC 7763(Milan)。
3D V-Cache 是 AMD 開(kāi)發(fā)的一項(xiàng)新技術(shù),可以讓 L3 緩存垂直堆疊,這樣可以在占用很少空間的情況下顯著增加緩存的大小。AMD 已經(jīng)通過(guò)新技術(shù)展示了令人印象深刻的性能提升,因?yàn)樗试S CPU 內(nèi)核始終如一地獲得更多信息。
單獨(dú)比較 Zen 3,有無(wú) 3D V-Cache 時(shí),Chips and Cheese 注意到,當(dāng)測(cè)試沒(méi)有使用更多的 L3 緩存時(shí),帶有 3D V-Cache 的EPYC 7V73的性能僅比普通 Zen 3 EPYC 7763 差一點(diǎn)。7763 必須提供什么。延遲差異為三到四個(gè)周期,由于 3D V-Cache,這是一個(gè)必要的權(quán)衡。
然而,一旦 7763 上的緩存被填滿,7V73 憑借其巨大的緩存大小,使得芯片的延遲比 7763 顯著減少,直到 3D V-Cache 被填滿。有趣的是,7V73 的內(nèi)存延遲也比 7763 略低。
在將 Zen 1 和 Zen 2 EPYC 芯片(如 7551 和 7452)添加到組合中時(shí),我們看到了 AMD 3D V-Cache 芯片真正經(jīng)過(guò)精心設(shè)計(jì)的更好畫(huà)面。Chips and Cheese 指出,L3 緩存設(shè)置為從 Zen 1 計(jì)數(shù)到 Zen 2 會(huì)產(chǎn)生大約 5 個(gè)周期的額外延遲。然后從 Zen 2 統(tǒng)一 Zen 3 上的雙 16MB L3 緩存塊的舉措增加了更高的 7 到 8 個(gè)延遲周期。
與此同時(shí),AMD 從 Zen 3 遷移到 Zen 3 3D V-Cache,并將 L3 緩存大小增加三倍只需要三到四個(gè)周期的延遲,這是迄今為止我們看到的最微不足道的損失。
Chips and Cheese 的圖表顯示,所有 Zen 世代的 L1 和 L2 緩存延遲幾乎相同。盡管如此,當(dāng)談到 L3 緩存時(shí),延遲會(huì)隨著代際之間的 L3 緩存使用量的增加而減少,尤其是在 Zen 3 到帶有 3D V-Cache 的 Zen 3 中。
帶寬
在帶寬結(jié)果中,Chips and Cheese 發(fā)現(xiàn) AMD 的 7V73X 3D V-Cache 提供的帶寬不如 AMD 所宣傳的那么多。在測(cè)試中,它注意到 7V73X 在單線程緩存帶寬測(cè)試中每個(gè)周期只增加了大約 25% 的字節(jié)——這與 AMD 承諾的 2 倍帶寬增益相去甚遠(yuǎn)。
然而,Chips 和 Cheese 認(rèn)為,一旦 CPU 處理利用 L3 緩存的更大工作負(fù)載,時(shí)鐘速度可能會(huì)降低,這確實(shí)解釋了這種差異。
另一個(gè)奇怪的現(xiàn)象出現(xiàn)在7V73X上,單顆CCD緩存帶寬測(cè)試顯示,3D V-Cache芯片的帶寬相比標(biāo)準(zhǔn)7763略有不足,約為12.5%。Chips and Cheese 懷疑這是為了控制功率,因?yàn)閮蓚€(gè)芯片上都加載了 64 個(gè)內(nèi)核。這很有意義,因?yàn)?3D V-Cache 確實(shí)占用了更多空間并且需要更多的功率,這使得 CPU 冷卻變得更加復(fù)雜。
有趣的是,同樣的現(xiàn)象也發(fā)生在 AMD 基于 Zen 2 微架構(gòu)的 EPYC 7452 芯片上。EPYC(霄龍)7763 Zen 3 CPU 是唯一一款在單 CCD 帶寬測(cè)試和單線程帶寬測(cè)試中表現(xiàn)均等的芯片。
對(duì)于那些想知道 Zen 1 的人來(lái)說(shuō),緩存帶寬甚至比 Zen 2 和 Zen 3 還差。在絕大多數(shù)測(cè)試中,經(jīng)過(guò)測(cè)試的 EPYC 7551 的帶寬不到一半。直到測(cè)試的中期和結(jié)束階段,它才接近趕上。
結(jié)論
那么所有這些數(shù)據(jù)在現(xiàn)實(shí)世界的表現(xiàn)方面意味著什么呢?Chips and Cheese 運(yùn)行了多個(gè)基準(zhǔn)測(cè)試,包括 Gem5、libx264 4K 轉(zhuǎn)碼、7-Zip 等。只有在 Gem5 中,3D V-Cache 才對(duì)性能產(chǎn)生了顯著影響。其余的則乏善可陳,幾乎不引人注意,大約 5% 的性能優(yōu)勢(shì)有利于 3D V-Cache 芯片。
Chips and Cheese 的初步結(jié)果表明,3D V-Cache 的影響并不像 AMD 已經(jīng)預(yù)測(cè)的那樣顯著。但是,它需要更深入的測(cè)試才能通過(guò)判斷。此外,我們不能忘記這是 AMD EYPC 服務(wù)器處理器上的 3D V-Cache,因此 3D V-Cache 在其消費(fèi)者對(duì)應(yīng)產(chǎn)品上的行為可能會(huì)有所不同。
一方面,7V73X 是一個(gè)擁有 64 個(gè)核心的怪物芯片,因此該芯片對(duì)熱量和功率輸出很敏感,如果需要,它會(huì)迅速限制 CPU 核心。它是通過(guò)添加緩存來(lái)調(diào)整的,對(duì) CPU 增加了更多的功率和散熱要求。
另一個(gè)是服務(wù)器工作負(fù)載,由于其性質(zhì),傳統(tǒng)上它的計(jì)算量比延遲敏感度更高。3D V-Cache 只有在內(nèi)核不是瓶頸并且不運(yùn)行需要大量時(shí)間來(lái)處理的線程時(shí)才會(huì)被證明是有用的。
在消費(fèi)領(lǐng)域,我們看到芯片的內(nèi)核數(shù)量大大減少,這降低了功率要求,并允許內(nèi)核在時(shí)鐘速度偏差較小的情況下伸展它們的腿。強(qiáng)大的冷卻系統(tǒng)和主板包含強(qiáng)大的供電解決方案,其空間遠(yuǎn)大于 CPU 在 PC DIY 空間中所需的空間,這不是問(wèn)題。
消費(fèi)場(chǎng)景中的應(yīng)用的計(jì)算密集度通常要低得多,這使得緩存延遲發(fā)揮了更關(guān)鍵的作用。這在視頻游戲中是非常正確的,其中 CPU 很少加載到 100%,但是具有較低的延遲意味著預(yù)渲染幀可以更快地傳輸?shù)?GPU,減少輸入延遲并提高幀速率。
參考鏈接:
https://www.tomshardware.com/news/amd-3d-v-cache-benchmarks-mixed-results-milan-x-cpus
https://chipsandcheese.com/2022/01/21/deep-diving-zen-3-v-cache/