英特爾支持 AI 工作站配備新的 GPU 和 AI 加速器
在 Computex 2025 上,英特爾發(fā)布了其 AI 聚焦硬件組合的大規(guī)模更新,鞏固了其在工作站和數(shù)據(jù)中心市場(chǎng)的地位。隨著 Arc Pro B 系列 GPU 和第三代 Gaudi AI 加速器的推出,英特爾正在將專業(yè)級(jí)的 AI 計(jì)算帶給更廣泛的開發(fā)者、創(chuàng)作者和企業(yè)用戶。
本文引用地址:http://2s4d.com/article/202505/470883.htm
Arc Pro B 系列:針對(duì)邊緣 AI 工作流的加速器
新推出的 Arc Pro B60 和 B50 顯卡 基于英特爾 Xe2 架構(gòu),并配備了集成的 XMX 核心,英特爾為 AI 優(yōu)化的向量和矩陣處理單元。這些顯卡是為建筑、工程和創(chuàng)意行業(yè)的 AI 推理和設(shè)計(jì)工作負(fù)載而專門設(shè)計(jì)的。
這兩款顯卡都支持 PCIe 5.0 x8 連接和容器化的 Linux AI 部署堆棧。
旗艦級(jí)的 Arc Pro B60 配備了 20 個(gè) Xe 核心、160 個(gè) XMX 引擎,以及通過 192 位總線連接的 24 GB GDDR6 內(nèi)存,提供 456 GB/s 的內(nèi)存帶寬和 197 TOPS(INT8)性能。B60 的功耗在 120 W 到 200 W 之間,支持多顯卡擴(kuò)展,并獲得了 SolidWorks、Maya 和 Blender 等主要 ISV 平臺(tái)的認(rèn)證。
同時(shí),B50 提供了更節(jié)能的解決方案,功耗為 70W,擁有 16 個(gè) Xe 核心 和 128 個(gè) XMX 引擎,提供 170 TOPS。它配備了 16GB 的 GDDR6 內(nèi)存,通過 128 位總線(帶寬 224 GB/s),使其適用于輕量級(jí) AI 任務(wù),如圖像上采樣或緊湊型工作站中的 CAD 加速。
Gaudi 3:企業(yè)級(jí) AI 的重型選手
在高端市場(chǎng),英特爾推出了其 Gaudi 3 加速器 ,這是一款雙芯片處理器,旨在處理生成式 AI 訓(xùn)練和大規(guī)模實(shí)時(shí)推理的需求。基于臺(tái)積電的 5 納米工藝,Gaudi 3 (白皮書鏈接) 擁有 8 個(gè)矩陣乘法引擎、64 個(gè)張量處理器核心,以及 128GB 的 HBM2e 內(nèi)存,帶寬為 3.7 TB/s。
其計(jì)算能力達(dá)到 1.8 PFLOPs,適用于 FP8 和 BF16 工作負(fù)載,與 Gaudi 2 相比,在架構(gòu)上有顯著改進(jìn),例如 MME 數(shù)量翻倍、內(nèi)存帶寬提升 1.5 倍,以及能效提升 40%。英特爾聲稱,Gaudi 3 在 LLM 訓(xùn)練中比英偉達(dá)的 H100 高出 1.7 倍,并在 Llama2-13 B 等關(guān)鍵工作負(fù)載中的推理效率高出 2.3 倍。
這些液冷系統(tǒng)針對(duì)分布式 AI 集群的持續(xù)性能進(jìn)行了優(yōu)化。
Gaudi 3 的一個(gè)關(guān)鍵差異化是其集成網(wǎng)絡(luò)。每顆芯片包含 24 個(gè)支持 RDMA 的 200 Gbps 以太網(wǎng)端口,支持 All2All 擴(kuò)展拓?fù)洌哂?1.05 TB/s 的雙向節(jié)點(diǎn)內(nèi)帶寬和 150 GB/s 的節(jié)點(diǎn)間擴(kuò)展。這種基于開放以太網(wǎng)的織物避免了供應(yīng)商鎖定,并簡(jiǎn)化了在不使用專有交換機(jī)的情況下擴(kuò)展到最多 512 個(gè)節(jié)點(diǎn)。
Intel AI Assistant Builder
補(bǔ)充新的芯片,Intel 的 AI 助手構(gòu)建器已退出測(cè)試版,現(xiàn)可在 GitHub 上使用 。這個(gè)開放框架允許開發(fā)者在 Intel 系統(tǒng)的本地構(gòu)建和運(yùn)行輕量級(jí) AI 代理。結(jié)合容器化的 Linux 支持和 ISV 認(rèn)證的驅(qū)動(dòng)程序,Intel 的軟件生態(tài)系統(tǒng)正緊密地與其硬件路線圖保持一致。
Arc Pro 系列支持 Windows 上的消費(fèi)者和專業(yè)驅(qū)動(dòng)程序堆棧,而 Gaudi 3 則利用了 Habana Synapse AI SDK,該 SDK 包括對(duì) PyTorch、TensorFlow 和 ONNX 的原生支持。這些工具針對(duì) MME 和 TPC 引擎的架構(gòu)特點(diǎn)進(jìn)行了優(yōu)化,并能在計(jì)算管道中混合工作負(fù)載實(shí)現(xiàn)粒度調(diào)度。
雖然 Nvidia 仍然主導(dǎo) AI 計(jì)算領(lǐng)域,但 Intel 的新 GPU 和 AI 加速器提供了一個(gè)有吸引力的替代方案,特別是對(duì)于那些尋求開放標(biāo)準(zhǔn)、靈活擴(kuò)展和高效大型模型部署的客戶。預(yù)計(jì)在 2025 年下半年實(shí)現(xiàn)商業(yè)可用性,Intel 的 AI 加速產(chǎn)品組合似乎已準(zhǔn)備好挑戰(zhàn)現(xiàn)有市場(chǎng)領(lǐng)導(dǎo)者。
評(píng)論