新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 華為將推出 CloudMatrix 384,據(jù)稱可提供 2× NVIDIA GB200 NVL72 吞吐量

華為將推出 CloudMatrix 384,據(jù)稱可提供 2× NVIDIA GB200 NVL72 吞吐量

作者: 時間:2025-07-21 來源:TrendForce 收藏

據(jù)經(jīng)濟日報報道,計劃于 2025 年世界大會(WAIC)首次推出其 CloudMatrix 384 系統(tǒng),該大會將于 26 日在上海開幕。正如 Tom’s Hardware 所強調(diào)的那樣,CloudMatrix 384 是一個機架級 AI 系統(tǒng),由 384 個 Ascend 910C 處理器組成,通過全光、全互連的網(wǎng)狀網(wǎng)絡(luò)互連。

盡管單個 Ascend 910C 芯片的性能僅約為 NVIDIA Blackwell 的三分之一,但報告指出通過在每個系統(tǒng)中部署大量芯片來彌補這一限制。這種方法使 CloudMatrix 384 實現(xiàn)了約 300 PFLOPs 的密集 BF16 計算能力——幾乎是 NVIDIA GB200 NVL72 的兩倍,該報告強調(diào)后者提供約 180 PFLOPs。

Tom’s Hardware 還指出,該系統(tǒng)提供了 2.1 倍的內(nèi)存總帶寬和超過 3.6 倍的高帶寬內(nèi)存(HBM)容量,同時依賴于 HBM2E 內(nèi)存。

同時,與依賴銅線互連的傳統(tǒng)系統(tǒng)不同,CloudMatrix 使用全光基礎(chǔ)設(shè)施進行機架內(nèi)和機架間的通信,從而實現(xiàn)極高的總帶寬。CloudMatrix 384 是一款可擴展的企業(yè)級系統(tǒng),配備容錯功能,適合高要求的 AI 工作負(fù)載,正如 Tom’s Hardware 所指出的。

CloudMatrix 384 的效率挑戰(zhàn)

然而,它的效率較低:每 FLOP 功耗是 NVIDIA 解決方案的 2.3 倍,每 TB 內(nèi)存帶寬效率是 1.8 倍,每 TB HBM 內(nèi)存效率是 1.1 倍,正如 Tom’s Hardware 所述。盡管如此,Tom’s Hardware 指出,在中國,能源豐富但先進硅片獲取有限,戰(zhàn)略似乎與當(dāng)?shù)貤l件非常契合。

正如 Igor’s Lab 引用 Financial Times 所指出的,CloudMatrix 384 的單價為 800 萬美元。其高昂的價格和巨大的功耗需求使得中小企業(yè)難以負(fù)擔(dān)。因此,該系統(tǒng)預(yù)計將主要作為大型企業(yè)的優(yōu)質(zhì)解決方案。報告還稱,據(jù)報道已有十家中國主要企業(yè)采用了該系統(tǒng),并將其集成到現(xiàn)有的數(shù)據(jù)中心基礎(chǔ)設(shè)施中。



關(guān)鍵詞: 華為 人工智能 AI計算平臺

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉