NVIDIA公布2026-2028年兩大GPU架構(gòu):搭配1TB HBM4e內(nèi)存
快科技3月19日消息,NVIDIA Blackwell架構(gòu)雖然在加速卡、游戲卡上都遭遇諸多波折,但這并不影響NVIDIA對于未來的宏偉規(guī)劃,不但公布了下一代Rubin架構(gòu)的具體產(chǎn)品規(guī)劃,還首次宣布了再下一代架構(gòu)“Feynman”。
本文引用地址:http://2s4d.com/article/202503/468454.htmFeynman就是理查德·費(fèi)曼,美籍猶太裔人,20世紀(jì)最偉大的物理學(xué)家之一,諾貝爾物理學(xué)獎獲得者,在量子電動力學(xué)、量子計算、納米技術(shù)等領(lǐng)域都有開創(chuàng)性的成就,還撰寫了《費(fèi)曼物理學(xué)講義》、提出了“費(fèi)曼學(xué)習(xí)法”,1986年挑戰(zhàn)者號航天飛機(jī)爆炸失事的根本原因也是他查明的。
NVIDIA這次一共宣布了三款產(chǎn)品,首先是“Blackwell Ultra NVL72”,今年下半年發(fā)布,每個節(jié)點(diǎn)配備兩顆升級版的Blackwell GPU、一顆Grace CPU,搭配多達(dá)288GB HBM3e高帶寬內(nèi)存,Dense FP4性能高達(dá)15PFlops(每秒1.5億億次)。
整臺服務(wù)器一共72個節(jié)點(diǎn),也就是144顆GPU、72顆CPU、20TB HBM3e、40TB DDR5內(nèi)存,比上代增加50%,CX8互連帶寬14.4TB/s,增加100%。
整機(jī)的Dense FP4推理性高達(dá)1.1EFlops(每秒110億億次),F(xiàn)P8訓(xùn)練性能高達(dá)0.36EFlps(36億億次),還有新的注意力指令。
2026年下半年,我們將迎來全新的Rubin架構(gòu),首發(fā)服務(wù)器產(chǎn)品為“Vera Rubin NVL144”,每個節(jié)點(diǎn)兩顆Rubin GPU搭配一顆全新的Vera CPU。
其中,Rubin GPU搭配288GB容量的下一代HBM4內(nèi)存,F(xiàn)P4浮點(diǎn)性能躍升到50PFlops(每秒5億億次)。
Vera CPU則包含88個自研Arm架構(gòu)核心,首次支持多線程而達(dá)到176線程,彼此之間通過1.8TB/s帶寬的NVLink-C2C總線連接在一起。
整臺服務(wù)器一共144個節(jié)點(diǎn),也就是288顆GPU、144顆CPU、41.5TB HBM4內(nèi)存(帶寬13TB/s),還有75TB的系統(tǒng)內(nèi)存,NVLink6帶寬達(dá)260TB/s,CX9總線帶寬達(dá)28.8TB/s。
FP4推理性能來到3.6EFlops(每秒360億億次),F(xiàn)P8訓(xùn)練性能則是1.2EFlops(每秒120億億次)。
2027年下半年,我們將看到升級版的“Rubin Ultra NVL576”,每個節(jié)點(diǎn)包含四顆Rubin GPU、一顆Vera GPU,并升級1TB HBM4e內(nèi)存,F(xiàn)P4浮點(diǎn)性能高達(dá)100PFlops(10億億次)。
整機(jī)一共多達(dá)576個節(jié)點(diǎn),也就是擁有2304顆Rubin GPU、576顆Vera CPU、576TB HBM5e(帶寬4.6PB/s),還有365TB系統(tǒng)內(nèi)存。
NVLink互連總線升級到第七代NVLink7,帶寬驚人的1.5PB/s,另外CX9總線帶寬115.2TB/s。
FP4推理性能高達(dá)15EFlops(每秒1500億億次),F(xiàn)P8訓(xùn)練性能5EFlops(每秒500億億次)。
至于新的Feynman架構(gòu),將在2028年首次登場,搭配下一代HBM內(nèi)存(HBM5?),但具體細(xì)節(jié)暫未披露。
評論