NVIDIA公布2026-2028年兩大GPU架構(gòu)：搭配1TB HBM4e內(nèi)存

作者：時間：2025-03-21 來源：快科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

快科技3月19日消息，NVIDIA Blackwell架構(gòu)雖然在加速卡、游戲卡上都遭遇諸多波折，但這并不影響NVIDIA對于未來的宏偉規(guī)劃，不但公布了下一代Rubin架構(gòu)的具體產(chǎn)品規(guī)劃，還首次宣布了再下一代架構(gòu)“Feynman”。

本文引用地址：http://2s4d.com/article/202503/468454.htm

Feynman就是理查德·費(fèi)曼，美籍猶太裔人，20世紀(jì)最偉大的物理學(xué)家之一，諾貝爾物理學(xué)獎獲得者，在量子電動力學(xué)、量子計算、納米技術(shù)等領(lǐng)域都有開創(chuàng)性的成就，還撰寫了《費(fèi)曼物理學(xué)講義》、提出了“費(fèi)曼學(xué)習(xí)法”，1986年挑戰(zhàn)者號航天飛機(jī)爆炸失事的根本原因也是他查明的。

NVIDIA這次一共宣布了三款產(chǎn)品，首先是“Blackwell Ultra NVL72”，今年下半年發(fā)布，每個節(jié)點(diǎn)配備兩顆升級版的Blackwell GPU、一顆Grace CPU，搭配多達(dá)288GB HBM3e高帶寬內(nèi)存，Dense FP4性能高達(dá)15PFlops(每秒1.5億億次)。

整臺服務(wù)器一共72個節(jié)點(diǎn)，也就是144顆GPU、72顆CPU、20TB HBM3e、40TB DDR5內(nèi)存，比上代增加50％，CX8互連帶寬14.4TB/s，增加100％。

整機(jī)的Dense FP4推理性高達(dá)1.1EFlops(每秒110億億次)，F(xiàn)P8訓(xùn)練性能高達(dá)0.36EFlps(36億億次)，還有新的注意力指令。

2026年下半年，我們將迎來全新的Rubin架構(gòu)，首發(fā)服務(wù)器產(chǎn)品為“Vera Rubin NVL144”，每個節(jié)點(diǎn)兩顆Rubin GPU搭配一顆全新的Vera CPU。

其中，Rubin GPU搭配288GB容量的下一代HBM4內(nèi)存，F(xiàn)P4浮點(diǎn)性能躍升到50PFlops(每秒5億億次)。

Vera CPU則包含88個自研Arm架構(gòu)核心，首次支持多線程而達(dá)到176線程，彼此之間通過1.8TB/s帶寬的NVLink-C2C總線連接在一起。

整臺服務(wù)器一共144個節(jié)點(diǎn)，也就是288顆GPU、144顆CPU、41.5TB HBM4內(nèi)存(帶寬13TB/s)，還有75TB的系統(tǒng)內(nèi)存，NVLink6帶寬達(dá)260TB/s，CX9總線帶寬達(dá)28.8TB/s。

FP4推理性能來到3.6EFlops(每秒360億億次)，F(xiàn)P8訓(xùn)練性能則是1.2EFlops(每秒120億億次)。

2027年下半年，我們將看到升級版的“Rubin Ultra NVL576”，每個節(jié)點(diǎn)包含四顆Rubin GPU、一顆Vera GPU，并升級1TB HBM4e內(nèi)存，F(xiàn)P4浮點(diǎn)性能高達(dá)100PFlops(10億億次)。

整機(jī)一共多達(dá)576個節(jié)點(diǎn)，也就是擁有2304顆Rubin GPU、576顆Vera CPU、576TB HBM5e(帶寬4.6PB/s)，還有365TB系統(tǒng)內(nèi)存。

NVLink互連總線升級到第七代NVLink7，帶寬驚人的1.5PB/s，另外CX9總線帶寬115.2TB/s。

FP4推理性能高達(dá)15EFlops(每秒1500億億次)，F(xiàn)P8訓(xùn)練性能5EFlops(每秒500億億次)。

至于新的Feynman架構(gòu)，將在2028年首次登場，搭配下一代HBM內(nèi)存(HBM5?)，但具體細(xì)節(jié)暫未披露。

新聞中心

NVIDIA公布2026-2028年兩大GPU架構(gòu)：搭配1TB HBM4e內(nèi)存

評論

相關(guān)推薦

技術(shù)專區(qū)