Supermicro攜手英偉達(dá)為AI加速，搭載Grace CPU超級(jí)芯片的服務(wù)器上市在即

發(fā)布人：12345zhi 時(shí)間：2023-06-09 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

橫空出世的ChatGPT，在全球掀起生成式人工智能熱潮，“大模型+大算力”讓AI實(shí)現(xiàn)范式突破，也讓算力成為搶手資源。而在算力的背后，是數(shù)據(jù)中心和“電老虎”的競(jìng)賽。

5月29日，在COMPUTEX2023（中國(guó)臺(tái)北國(guó)際計(jì)算機(jī)展）上，IT解決方案提供商Supermicro提出了兩個(gè)關(guān)鍵詞：加速和降耗。Supermicro采用Server Building Block Solutions服務(wù)器構(gòu)建方法，整合Intel、AMD和NVIDIA的最新CPU及GPU技術(shù)，設(shè)計(jì)和制造服務(wù)器和存儲(chǔ)系統(tǒng)，以應(yīng)對(duì)AI、云計(jì)算、5G以及從數(shù)據(jù)中心到邊緣計(jì)算的大量需求。

“我們的機(jī)架級(jí)液冷方案可以將數(shù)據(jù)中心的電力支出降低40%，并能加快上市時(shí)間，每月向全球發(fā)運(yùn)4000機(jī)架，預(yù)計(jì)到年底將提高到5000以上?！?Supermicro總裁兼首席執(zhí)行官梁見后（Charles Liang）表示。

Supermicro攜手英偉達(dá)為AI加速，搭載Grace CPU超級(jí)芯片的服務(wù)器上市在即

Supermicro已有產(chǎn)品組合可為人工智能工作負(fù)載和其他垂直領(lǐng)域提供支持。基于第四代Intel Xeon可擴(kuò)展處理器和第四代AMD EPYC 處理器的單插槽和雙插槽機(jī)架安裝系統(tǒng)，提供1U、2U、4U、5U和8U規(guī)格，并支持1到10 GPU。此外還包括在8U機(jī)箱中支持20個(gè)NVIDIA H100 GPU的密度優(yōu)化型SuperBlade系統(tǒng)，以及專門針對(duì)物聯(lián)網(wǎng)和邊緣環(huán)境設(shè)計(jì)的SuperEdge系統(tǒng)。最新發(fā)布的E3.S Petascale存儲(chǔ)系統(tǒng)在利用超大規(guī)模的人工智能數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí)，其性能、容量、吞吐量、耐用性以及能效表現(xiàn)都較好。

Supermicro攜手英偉達(dá)為AI加速，搭載Grace CPU超級(jí)芯片的服務(wù)器上市在即

在英偉達(dá)發(fā)布超大規(guī)模生成式AI加速平臺(tái)這一算力“殺器”的同一時(shí)間，Supermicro宣布，基于NVIDIA Grace CPU超級(jí)芯片的新產(chǎn)品系列將很快上市。這些新服務(wù)器均包含144個(gè)核心，雙CPU及900 GB/s 一致性接口，可運(yùn)行高響應(yīng)度的人工智能應(yīng)用程序和需要極低延遲響應(yīng)的應(yīng)用程序。此外，CPU以500W TDP的速度運(yùn)行，該系統(tǒng)將為云原生工作負(fù)載和下一代人工智能應(yīng)用降低能耗。

NVIDIA超大規(guī)模和高性能計(jì)算副總裁Ian Buck表示：“面對(duì)嚴(yán)苛的客戶需求，NVIDIA與Supermicro快速為新的服務(wù)器設(shè)計(jì)帶來(lái)創(chuàng)新。隨著Supermicro采用Grace CPU 超級(jí)芯片的服務(wù)器上市在即，以及H100 GPU在全球范圍的使用普及，我們正在共同努力，將人工智能帶到廣泛的市場(chǎng)和應(yīng)用中?！?/p>

生成式AI給算力帶來(lái)了巨大的挑戰(zhàn)，Supermicro的應(yīng)對(duì)方案是GPU服務(wù)器集成雙CPU和多達(dá)8個(gè)NVIDIA HGX H100 GPU，并用液體冷卻降低運(yùn)營(yíng)成本。此外，Supermicro正在支持新的NVIDIA MGX參考架構(gòu)，該架構(gòu)將為一系列人工智能、高性能計(jì)算和Omniverse應(yīng)用提供超過(guò)100種服務(wù)器配置。這種模塊化的參考架構(gòu)包括CPU、GPU和DPU，適用于多代處理器。

Supermicro還將在廣泛的解決方案中納入最新的NVIDIA Spectrum-X網(wǎng)絡(luò)平臺(tái)。該平臺(tái)是第一個(gè)專門為提高基于以太網(wǎng)的AI云的性能和效率而設(shè)計(jì)的平臺(tái)。Spectrum-X建立在由NVIDIA Spectrum-4以太網(wǎng)交換機(jī)與NVIDIA BlueField-3數(shù)據(jù)處理單元（DPU）緊密耦合的網(wǎng)絡(luò)創(chuàng)新之上。這項(xiàng)突破性技術(shù)實(shí)現(xiàn)了1.7倍的整體人工智能性能和能源效率提升，同時(shí)在多租戶環(huán)境中實(shí)現(xiàn)了一致、可預(yù)測(cè)的性能。

目前，數(shù)據(jù)中心消耗的電力占到了全球電力需求的1%至1.5%，因此綠色計(jì)算對(duì)于數(shù)據(jù)中心至關(guān)重要。Supermicro機(jī)架級(jí)液冷解決方案可以大幅降低對(duì)傳統(tǒng)冷卻方法的需求。通過(guò)冗余和熱插拔電源和泵，機(jī)架上的所有高性能AI和HPC優(yōu)化服務(wù)器都能夠得到有效冷卻，不用擔(dān)心電源或泵發(fā)生任何故障。該解決方案還為CPU和GPU量身定制了水冷板，相較于傳統(tǒng)設(shè)計(jì)能夠更有效地去除熱量。如果數(shù)據(jù)中心利用Supermicro技術(shù)將其PUE降低至近1.0，能節(jié)省高達(dá)100億美元的能源成本，相當(dāng)于減少建造30座化石燃料發(fā)電廠。

Supermicro攜手英偉達(dá)為AI加速，搭載Grace CPU超級(jí)芯片的服務(wù)器上市在即

機(jī)架級(jí)集成是數(shù)據(jù)中心運(yùn)營(yíng)商所需的另一項(xiàng)核心競(jìng)爭(zhēng)力。要想給生產(chǎn)效率加速，就必須將隨時(shí)可用的全部機(jī)架及時(shí)交付給數(shù)據(jù)中心。Supermicro的 L11和L12服務(wù)器集群已通過(guò)全面測(cè)試并且進(jìn)行適當(dāng)配置，可以在必要時(shí)實(shí)現(xiàn)大規(guī)模液體冷卻。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

Supermicro攜手英偉達(dá)為AI加速，搭載Grace CPU超級(jí)芯片的服務(wù)器上市在即

相關(guān)推薦

技術(shù)專區(qū)