谷歌最強 TPU Trillium 芯片商用:性能提升 4.7 倍、內(nèi)存帶寬翻番、節(jié)能 67%
12 月 12 日消息,谷歌今天(12 月 12 日)發(fā)布博文,宣布正式向 Google Cloud 客戶開放第六代 TPU Trillium,希望憑借大的計算能力、高效的性能和可持續(xù)特性,更好推動 AI 模型發(fā)展。
本文引用地址:http://2s4d.com/article/202412/465464.htmTrillium TPU 是 Google Cloud AI 超級計算機(AI Hypercomputer)的關鍵組件,是一種突破性的超級計算機架構,采用了一個由性能優(yōu)化的硬件、開放軟件、領先的機器學習框架和靈活的消費模型組成的集成系統(tǒng)。
曾于今年 5 月有報道,在 I/O 開發(fā)者大會上,谷歌正式宣布 Trillium TPU。官方稱相比上一代,Trillium TPU 在訓練性能上提升 4 倍以上,推理吞吐量提升高達 3 倍,峰值計算性能提升 4.7 倍。
在效率方面,Trillium TPU 能源效率提高 67%,每美元訓練性能提升高達 2.5 倍,推理性能提升高達 1.4 倍。
在規(guī)模擴展方面,單個 Jupiter 網(wǎng)絡結構可容納 10 萬個 Trillium 芯片,雙倍的 HBM 容量和 ICI 帶寬,支持大規(guī)模 AI 訓練。
官方稱 Trillium 近乎線性的擴展能力,配合高速芯片互連和 Jupiter 數(shù)據(jù)中心網(wǎng)絡,顯著加快大型模型訓練速度,在訓練 gpt3-175b 模型時,即使跨數(shù)據(jù)中心網(wǎng)絡運行,24 個 Pod(6144 個芯片)也能達到 94% 的擴展效率。
評論