解密 Google Axion:為 AI 時代而生的 Arm 架構定制處理器
作者:Arm 基礎設施事業(yè)部服務器生態(tài)系統(tǒng)開發(fā)總監(jiān) Bhumik Patel
本文引用地址:http://2s4d.com/article/202504/469642.htm云計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm Neoverse 平臺滿足不斷變化的需求,Neoverse 也正因此迅速成為開發(fā)者作為構建未來的云基礎設施的首選計算平臺。
Google Cloud 攜手 Arm,設計了針對實際性能進行調優(yōu)的定制芯片。作為其首款基于 Neoverse 平臺的定制 CPU, Google Axion 的性能優(yōu)于傳統(tǒng)處理器,并具有更出色的性能、效率與擴展性。雙方的合作為開發(fā)者帶來了更優(yōu)選擇,并共同推動了云計算創(chuàng)新。
在 Google Cloud 內外均備受青睞
Google Axion 處理器基于 Arm Neoverse V2 平臺構建,可為各種工作負載提供卓越性能和能效,包括云原生應用、高要求的 AI 模型以及大量 Google Cloud 服務,例如 Compute Engine、Google Kubernetes Engine (GKE)、Batch、Dataproc 、Dataflow,以及目前處于預覽階段的 AlloyDB 和 Cloud SQL。
從內容流媒體到企業(yè)級數(shù)據(jù)服務,各行業(yè)的企業(yè)都在使用基于 Arm 架構的 Axion 處理器,并在計算效率、可擴展性和 TCO 方面實現(xiàn)了顯著改進。ClickHouse、Dailymotion、Databricks、Elastic、loveholidays、MongoDB、Palo Alto Networks、Paramount Global、Redis Labs 和 Starburst 等 Google Cloud 的客戶都已取得了變革性的成果。例如,Spotify 通過使用基于 Axion 的 C4A 虛擬機,使其性能提高了約 250%。
突破性能局限
Google Axion 處理器在 AI 推理工作負載和通用計算方面均有出色表現(xiàn)。針對 AI 推理,Axion 的專用優(yōu)化可顯著提高性能,使 AI 工作負載能夠更快、更高效地運行。自然語言處理、計算機視覺和推薦系統(tǒng)等應用均可得益于此。AI 開發(fā)者可以利用到 Arm Kleidi 的優(yōu)勢,這是一組輕量級、高性能的開源庫。Kleidi 通過與熱門框架集成,使得開發(fā)者無需額外的開發(fā)工作,即可顯著提升在 Arm 平臺上運行的 AI 應用的性能。
Axion 處理器利用 Arm 平臺的先進架構功能,使開發(fā)者能夠在不犧牲速度或性能的情況下規(guī)?;渴饛碗s的 AI 模型。
例如,與基于 x86 架構的方案相比,針對 Axion 的 MLPerf DLRMv2 基準測試的全精度性能提高了三倍,展示了其在推薦系統(tǒng)中的卓越能力。許多用戶更青睞 FP32 精度,以避免因采用 INT8 等低精度格式而導致的準確性問題,從而減少因這類問題引起的銷售損失、客戶滿意度降低以及品牌聲譽受損。
另一個示例則是,AI 聊天機器人有時會提供過時或不準確的答案,檢索增強生成 (RAG) 方法提供了功能強大的解決方案來提高其準確性和相關性。測試顯示,與 x86 架構方案相比,當 RAG 應用在 Axion 處理器上運行時,其性能可最高提升 2.5 倍。 (有關該示例的詳細內容,敬請期待后續(xù)文章?。?/span>
從下圖可以看到,Axion 處理器使通用工作負載實現(xiàn)了顯著的性能提升。通過優(yōu)化高吞吐量和低延遲,Axion 處理器實現(xiàn)了更快的應用響應時間、增強用戶體驗,并提高資源利用率,是 Web 服務器、數(shù)據(jù)庫、分析和容器化微服務的理想選擇。
與此同時,得益于基于 Axion 的 C4A 虛擬機將原生 Neoverse 核心的性能與每個 vCPU 的充足內存帶寬相結合,其特別適用于高性能計算 (HPC) 工作負載。HPC 開發(fā)者可以充分利用 Neoverse 平臺上所提供的開源及商用科學計算應用和框架的豐富生態(tài)系統(tǒng),包括 Arm Compiler for Linux 和 Arm Performance Libraries。Arm 在行業(yè)標準的碰撞和沖擊仿真應用 Altair ? OpenRadioss? 上的測試顯示,在基于 Axion 的 C4A 虛擬機上運行具有顯著的性能優(yōu)勢。
加速云遷移進程
為了支持和加速開發(fā)者在云端采用 Arm 架構, Arm 近期發(fā)布了全面的云遷移資源 。其核心是新的 Cloud Migration Resource Hub(云遷移資源中心),其中涵蓋了超過 100 個詳細的 Learning Path 教程,旨在指導開發(fā)者如何跨多個平臺無縫遷移常見工作負載。與此同時,支持 Axion 的獨立軟件供應商 (ISV) 也在不斷增加,包括 Applause、Couchbase、Honeycomb、IBM Instana Observability、Verve 和 Viant 等知名企業(yè)。 Arm Software Ecosystem Dashboard 可以讓開發(fā)者更易了解適用于 Neoverse 平臺的主要開源和商用軟件的可用版本和推薦版本。并在其軟件開發(fā)的伊始,便能確保軟件的兼容性和平穩(wěn)運行。
這些資源使有興趣采用或遷移到基于 Axion 的 C4A 虛擬機的開發(fā)者能夠獲得 Arm 的社區(qū)支持,例如專為遷移而設的 GitHub 代碼倉庫等。Arm 的云遷移專家還可提供直接的工程協(xié)助和個性化支持,尤其是對于企業(yè)級遷移,以便助力遷移項目順利且成功的過渡到基于 Axion 的解決方案。
寫在最后
Google Cloud 推出 Axion 處理器意在為客戶提供更多樣化、更高性能的計算選擇。得益于 Arm 架構和 Google 的定制芯片設計,Axion 可為從高要求的 AI 推理和 HPC 應用到通用和云原生服務等各種工作負載提供卓越性能和效率,通過與 Arm 的云遷移資源和強大的軟件生態(tài)系統(tǒng)相結合,全方位賦能開發(fā)者在 Arm 平臺上構建計算的未來!
評論