新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 市場(chǎng)分析 > 英偉達(dá)甩出三大「王炸」

英偉達(dá)甩出三大「王炸」

作者: 時(shí)間:2025-03-21 來(lái)源:半導(dǎo)體產(chǎn)業(yè)縱橫 收藏

在今日凌晨的 GTC 2025 大會(huì)主題演講中, CEO 黃仁勛再次身穿皮衣登場(chǎng),兩個(gè)小時(shí)的時(shí)長(zhǎng)被芯片架構(gòu)、數(shù)據(jù)中心、自動(dòng)駕駛、AI 計(jì)算機(jī)以及機(jī)器人等關(guān)鍵分享塞得滿滿的。

本文引用地址:http://2s4d.com/article/202503/468430.htm

演講的開篇,黃仁勛強(qiáng)調(diào)了計(jì)算和軟件的重要性,他表示:世界正在進(jìn)行一場(chǎng)過渡——計(jì)算方式迎來(lái)變革、軟件的未來(lái)需要資本投資。

Blackwell Ultra 芯片:推理性能較前代暴漲 40 倍

正如大家期待的那般,在 GTC 大會(huì)上宣布推出 Blackwell Ultra 芯片,其包括 GB300 NVL72 機(jī)架級(jí)解決方案和 NVIDIA HGX B300 NVL16 系統(tǒng)。

其中,GB300 NVL72 將 72 個(gè) Blackwell Ultra GPU 與 36 個(gè)基于 Arm Neoverse 的 Grace CPU 相連,有效地充當(dāng)一個(gè)大規(guī)模 GPU 來(lái)支持復(fù)雜問題解決并提高響應(yīng)質(zhì)量?;诂F(xiàn)有 Blackwell 架構(gòu)的 Blackwell Ultra 預(yù)計(jì)將比前代產(chǎn)品提供 1.5 倍的 AI 性能,顯著增加 AI 工廠的收入機(jī)會(huì)。

而 HGX B300 NVL16 是服務(wù)器級(jí)產(chǎn)品,搭載 16 個(gè) Blackwell Ultra GPU,對(duì)比前代 Blackwell GPU,大語(yǔ)言模型推理速度提升 11 倍,計(jì)算能力提高 7 倍,內(nèi)存容量增加 4 倍。

黃仁勛在演講中強(qiáng)調(diào),Blackwell Ultra 是為「推理和代理型 AI」時(shí)代設(shè)計(jì)的平臺(tái),可高效支持大模型的預(yù)訓(xùn)練、微調(diào)及實(shí)時(shí)推理,并稱其為英偉達(dá)「最強(qiáng)大的芯片」,推動(dòng) AI 基礎(chǔ)設(shè)施向推理優(yōu)化轉(zhuǎn)型。

黃仁勛表示,「在推理模型中,Blackwell 的性能是 Hopper 的 40 倍」。在展示中,傳統(tǒng)模型的代表是 Meta Llama 3.3,而推理模型是 DeepSeek 的 R1。

值得一提的是,GB300 系列將于 2025 年 5 月啟動(dòng)量產(chǎn),B300 系列計(jì)劃下半年交付,配套服務(wù)器系統(tǒng)同步上市。其中,臺(tái)積電負(fù)責(zé)芯片制造,SK 海力士提供 HBM3e 內(nèi)存,超微負(fù)責(zé)服務(wù)器集成,確保產(chǎn)能穩(wěn)定。

據(jù)英偉達(dá)透露,全球四大云巨頭部署的 Blackwell 芯片數(shù)量已達(dá) Hopper 芯片的三倍,2024 年他們共采購(gòu)了 130 萬(wàn)片 Hopper 架構(gòu)芯片。2025 年又購(gòu)買了 360 萬(wàn) Blackwell 芯片??紤]到每顆 Blackwell 芯片的售價(jià)高達(dá)數(shù)萬(wàn)美元,這意味著數(shù)十億美元的市場(chǎng)規(guī)模。黃仁勛打趣道,在最新技術(shù)的加持下,搭建 AI 工廠的廠商「買得越多、省得越多」,總而言之就是掏錢吧。

英偉達(dá)新一代 AI 芯片 Rubin 于 2026 下半年推出

黃仁勛重磅公布了新一代 AI 芯片 Rubin,也就是 Hopper、Blackwell 之后的下一代架構(gòu)。Rubin 的命名風(fēng)格延續(xù)了英偉達(dá)一直以來(lái)以杰出科學(xué)家命名芯片架構(gòu)的傳統(tǒng),是為紀(jì)念「證實(shí)暗物質(zhì)存在」的女性科學(xué)先驅(qū)薇拉?魯賓(Vera Rubin,1928–2016,婚前姓 Cooper)。

Vera Rubin 和 Grace Blackwell 類似,集成了 CPU 和 GPU。在 Grace Blackwell 中,Grace 是 CPU,Blackwell 是 GPU;而在 Vera Rubin 中,Vera 是 CPU,Rubin 是 GPU。

其中,Vera CPU 是英偉達(dá)首次基于自主架構(gòu) Olympus 設(shè)計(jì)的處理。此前,英偉達(dá)一直使用 Arm 授權(quán)的通用 CPU 設(shè)計(jì),這在某種程度上限制了其系統(tǒng)級(jí)優(yōu)化能力。隨著 AI 計(jì)算負(fù)載的特殊性日益凸顯,通用 CPU 已難以滿足極致性能和能效比的要求。英偉達(dá)表示,Vera CPU 的內(nèi)存是 Grace 的 4.2 倍,內(nèi)存帶寬是 Grace 的 2.4 倍。結(jié)合 Vera 的 88 個(gè) CPU 內(nèi)核,英偉達(dá)稱該芯片的整體性能將是前一代產(chǎn)品的兩倍。

而 Rubin GPU 的創(chuàng)新之處在于其雙 GPU 架構(gòu)設(shè)計(jì)。與 Blackwell 一樣,Rubin 也采用了多芯片封裝技術(shù),但英偉達(dá)對(duì)這一技術(shù)的定義進(jìn)行了重要調(diào)整。從 Rubin 開始,英偉達(dá)將多芯片模塊中的每個(gè)裸片視為獨(dú)立的 GPU,而非整體一個(gè) GPU。這一定義變更不僅是技術(shù)表述的調(diào)整,更反映了英偉達(dá)對(duì)未來(lái) GPU 架構(gòu)發(fā)展的戰(zhàn)略思考。

在推理性能方面,Rubin 實(shí)現(xiàn)了驚人的 50 petaflops,是當(dāng)前 Blackwell 芯片的 2.5 倍。同時(shí),其 288GB 的超大內(nèi)存容量,為處理超大規(guī)模 AI 模型提供了充足的空間。這意味著 Rubin 能夠更高效地運(yùn)行如 GPT-4 等數(shù)萬(wàn)億參數(shù)的超大模型,使實(shí)時(shí)推理和更復(fù)雜的推理任務(wù)成為可能。

英偉達(dá)還公布了"Rubin Next"的開發(fā)計(jì)劃,Vera Rubin 之后的一代芯片,名為 Vera Rubin Ultra。將于 2027 年下半年上市的 Vera Rubin Ultra 將把 Vera CPU 和 Rubin Ultra 芯片結(jié)合在一起。每個(gè) Rubin 處理器由兩個(gè) GPU 組成一個(gè)單芯片,而 Rubin Ultra 則由四個(gè) GPU 裸片組成,進(jìn)一步將性能翻倍。這種"更多 GPU"的集成策略,與行業(yè)的多芯片模塊(MCM)和芯粒(Chiplet)趨勢(shì)相呼應(yīng),代表了高性能計(jì)算芯片的未來(lái)發(fā)展方向。

黃仁勛展示了 Vera Rubin NVLink576 的外觀和參數(shù),并宣稱 Rubin 的性能可達(dá) Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。

Blackwell Ultra 和 Vera Rubin 的發(fā)布,標(biāo)志著英偉達(dá)已成功將芯片更新周期從兩年縮短至一年。

在本次發(fā)布會(huì),英偉達(dá)公開了其產(chǎn)品路線圖:Blackwell(2024 年) → Blackwell Ultra(2025 年) → Vera Rubin(2026 年) → Rubin Next(2027 年) → Feynman(2028 年)。這一清晰的"雙芯雙代"發(fā)展路線(每?jī)纱軜?gòu)各兩款芯片),讓英偉達(dá)能夠在保持技術(shù)領(lǐng)先的同時(shí),最大化每代架構(gòu)的商業(yè)價(jià)值。

值得一提的是,在 Rubin 之后的下一代 AI 芯片架構(gòu),英偉達(dá)將其命名為 Feynman,取自著名物理學(xué)家理查德?費(fèi)曼。他是美國(guó)理論物理學(xué)家,以對(duì)量子力學(xué)的路徑積分表述、量子電動(dòng)力學(xué)、過冷液氦的超流性以及粒子物理學(xué)中部分子模型的研究聞名于世。根據(jù)英偉達(dá)路線圖,F(xiàn)eynman 架構(gòu)將于 2028 年登場(chǎng)。

掀起小高潮的 AI 計(jì)算機(jī)與機(jī)器人

除了芯片,此次 GTC 大會(huì)的另一個(gè)小高潮就是黃仁勛介紹英偉達(dá)在 AI 計(jì)算機(jī)和機(jī)器人產(chǎn)線的突破。

英偉達(dá)推出了新款 DGX Spark 和 DGX Station 個(gè)人 AI 計(jì)算機(jī),黃仁勛稱其為「AI 時(shí)代的超級(jí)計(jì)算機(jī)」。

據(jù)介紹,這兩款超級(jí)計(jì)算機(jī)均由 Grace Blackwell 平臺(tái)支持,旨在「讓 AI 開發(fā)人員、研究人員、數(shù)據(jù)科學(xué)家和學(xué)生在桌面上對(duì)大模型進(jìn)行原型設(shè)計(jì)、微調(diào)和推理」。

其中,Spark 搭載了 GB10 Blackwell 芯片,提供第五代 Tensor Core 和 FP4 支持,具有 128GB 統(tǒng)一內(nèi)存和高達(dá) 4TB 的 NVMe SSD 存儲(chǔ),可以提供「高達(dá)每秒 1 千萬(wàn)億次運(yùn)算的 AI 計(jì)算?!?/p>

而體積更大的 DGX Station 可以容納英偉達(dá)剛剛宣布的功能更強(qiáng)大的 GB300 Blackwell Ultra 芯片,可提供「每秒 20 千萬(wàn)億次運(yùn)算的 AI 性能和 784GB 的統(tǒng)一系統(tǒng)內(nèi)存」。

Spark 將于今日開始預(yù)訂,售價(jià) 3000 美元起。DGX Station 目前尚未定價(jià)。

在機(jī)器人領(lǐng)域,英偉達(dá)推出了全球首款開源人形機(jī)器人功能模型 GR00T N1。

基礎(chǔ)模型采用雙系統(tǒng)架構(gòu),其靈感來(lái)自人類認(rèn)知原理?!赶到y(tǒng) 1」是一種快速思考的行動(dòng)模型,反映了人類的反應(yīng)或直覺?!赶到y(tǒng) 2」則是一種慢速思考的模型,用于深思熟慮、有條不紊的決策。

在視覺語(yǔ)言模型的支持下,系統(tǒng) 2 可以推理其環(huán)境和收到的指令,從而規(guī)劃行動(dòng)。然后,系統(tǒng) 1 將這些計(jì)劃轉(zhuǎn)化為精確、連續(xù)的機(jī)器人動(dòng)作。

目前,可以實(shí)現(xiàn)常見任務(wù),例如抓取、用一只或兩只手移動(dòng)物體,以及將物品從一只手轉(zhuǎn)移到另一只手,或者執(zhí)行需要技能組合的多步驟任務(wù)。開發(fā)人員和研究人員可以使用真實(shí)或合成數(shù)據(jù)對(duì) 進(jìn)行后期訓(xùn)練,以適應(yīng)特定的人形機(jī)器人或任務(wù)。



關(guān)鍵詞: 英偉達(dá) GR00T N1

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉