新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > 新的Armv9 CPU加速AI在移動(dòng)設(shè)備等領(lǐng)域的發(fā)展

新的Armv9 CPU加速AI在移動(dòng)設(shè)備等領(lǐng)域的發(fā)展

作者:Arm終端事業(yè)部CPU產(chǎn)品管理總監(jiān)Saurabh Pradhan 時(shí)間:2024-06-13 來(lái)源:EEPW 收藏

當(dāng)今上的大多數(shù)人工智能 (AI) 工作負(fù)載均可在 Arm CPU 上運(yùn)行。在智能手機(jī)領(lǐng)域,基于 CPU 技術(shù)構(gòu)建的 AI 旗艦智能手機(jī)立于技術(shù)前沿,其中包括搭載MediaTek天璣9300芯片的vivo X100和X100 Pro智能手機(jī)、三星Galaxy S24 以及Google Pixel 8,為AI創(chuàng)新提供了前所未有的機(jī)遇。

本文引用地址:http://2s4d.com/article/202406/459862.htm

隨著 AI 工作負(fù)載的計(jì)算強(qiáng)度及復(fù)雜度持續(xù)增長(zhǎng),Arm 最新的 .2 CPU 集群帶來(lái)更強(qiáng)性能、更高效率,以及更多功能,為新一代 AI 奠定扎實(shí)基礎(chǔ)。這些優(yōu)勢(shì)可擴(kuò)展到包括旗艦智能手機(jī)、AI PC,以及主流、XR 和可穿戴設(shè)備等在內(nèi)的各類(lèi)消費(fèi)電子設(shè)備,彰顯了我們致力于實(shí)現(xiàn)無(wú)處不在的 AI 所作的努力。

新增至 CPU 組合的新品包括具備超強(qiáng)性能的Arm Cortex-X925 CPU 和可持續(xù)提供出色性能的Arm Cortex-A725 CPU,而更新后的Arm Cortex-A520可為低強(qiáng)度工作負(fù)載提供更卓越的能效表現(xiàn)。與此同時(shí),我們也更新了DynamIQ Shared Unit (DSU-120),從而在 Armv9.2 CPU 集群配置中,降低功耗和縮小面積。這些產(chǎn)品被集成至 Arm 迄今為止針對(duì)安卓系統(tǒng)速度最快的計(jì)算平臺(tái)——新的Arm終端計(jì)算子系統(tǒng)(CSS)。

1718273400523699.png

圖 Armv9 CPU系列的新產(chǎn)品及更新

Cortex-X925實(shí)現(xiàn)了最顯著的Cortex-X性能提升

Cortex-X925(內(nèi)部代號(hào)為 Blackhawk)與此前的 Cortex-X 產(chǎn)品相比,實(shí)現(xiàn)了最高的同比性能提升,重新定義了計(jì)算性能的發(fā)展軌跡。Cortex-X925 的單線(xiàn)程(峰值)性能提高了 36%(與 2023 年高端安卓手機(jī)上運(yùn)行 Geekbench 6.2 相比),并且其 AI 性能提升了 46%(與前代 Cortex-X4 CPU 上的 Phi-3 詞元首次響應(yīng)時(shí)間相比)。

1718273486338643.png

圖 Cortex-X925性能提升

Cortex-X925 的功耗性能配置意味著它能在關(guān)鍵時(shí)刻提供峰值性能。這有助于提高跨應(yīng)用、生成式 AI 工作負(fù)載、網(wǎng)頁(yè)瀏覽、攝像頭后處理、視頻錄制和 AAA 游戲的響應(yīng)能力,進(jìn)而帶來(lái)更優(yōu)異的用戶(hù)體驗(yàn)。

這些性能提升得益于 Cortex-X925 出眾的性能基礎(chǔ)及其開(kāi)創(chuàng)性的新微架構(gòu)。Cortex-X925 通過(guò)經(jīng)優(yōu)化的三納米工藝,輔以卓越的子系統(tǒng)和封裝,使得新一代消費(fèi)電子設(shè)備的性能分?jǐn)?shù)可提高 30% 以上。包括高達(dá) 3MB 的私有 L2 緩存在內(nèi)的微架構(gòu)改進(jìn),提供了更強(qiáng)的 CPU 集群可配置性,讓各類(lèi)消費(fèi)電子設(shè)備的創(chuàng)新成為可能。

作為 Arm 終端 CSS的一部分,我們協(xié)同設(shè)計(jì)并交付了 CPU 物理實(shí)現(xiàn)。我們攜手領(lǐng)先的代工廠(chǎng)合作伙伴,實(shí)現(xiàn)了流片就緒的 Cortex-X925 三納米工藝的物理實(shí)現(xiàn),助力我們的合作伙伴能夠在三納米工藝上充分發(fā)揮功耗、性能和面積 (PPA) 優(yōu)勢(shì),同時(shí)通過(guò)大批量生產(chǎn)就緒的芯片解決方案來(lái)縮短芯片的開(kāi)發(fā)與部署進(jìn)程。

Cortex-A725持續(xù)提供出色性能

Arm Cortex-A700 系列 CPU 的出色性能效率一脈相承,Cortex-A725 也不例外。作為 CPU 工作負(fù)載的主力,我們的工程和設(shè)計(jì)團(tuán)隊(duì)就 Cortex-A725 進(jìn)行了針對(duì)性更新,著力于需要持續(xù)出色性能的關(guān)鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

1718273563879100.png

圖 Cortex-A725性能和能效提升

Cortex-A725 的性能效率提升同樣得益于其微架構(gòu)的改進(jìn)。和 Cortex-X925 一樣,通過(guò) Arm 先進(jìn)的物理實(shí)現(xiàn),我們?cè)谌{米工藝上優(yōu)化了 Cortex-A725 的實(shí)現(xiàn)。我們還可為主流消費(fèi)技術(shù)市場(chǎng)提供面積優(yōu)化的實(shí)現(xiàn)。

Cortex-A520和DSU-120的更新

Cortex-A520已針對(duì)Arm終端CSS進(jìn)行更新,從而提供更為出色的能效,與 2023 Arm 全面計(jì)算解決方案 (TCS23) 中的 Cortex-A520 相比,其效率提升了 15%。Cortex-A520 的更新得益于更新的實(shí)現(xiàn)與先進(jìn)的三納米物理實(shí)現(xiàn)。

1718273585553551.png

圖 更新后的Cortex-A520

作為新的Arm終端CSS的一部分,DSU-120 已針對(duì)新一代用例和消費(fèi)電子設(shè)備體驗(yàn)進(jìn)行了強(qiáng)化。其中包括新的性能和效率功能、新的低功耗模式和面向主流消費(fèi)電子設(shè)備的強(qiáng)化,并保留了為高性能用例擴(kuò)展到 14 個(gè)核心的選項(xiàng)。得益于此,典型工作負(fù)載的功耗顯著降低 50%,并且整個(gè) CPU 集群的緩存未命中功耗降低 60%,從而減少漏電并延長(zhǎng)設(shè)備的電池壽命。新的低功耗模式(例如 half slice power down 和 quick nap)和增強(qiáng)功能支持大量低強(qiáng)度和高強(qiáng)度的 AI 工作負(fù)載,包括生物特征識(shí)別、語(yǔ)音轉(zhuǎn)文本、AI 智能攝像頭、內(nèi)容創(chuàng)建和基于機(jī)器學(xué)習(xí) (ML) 的 AAA 游戲。

1718273639244877.png

圖 DSU-120更新和提升

Arm性能最強(qiáng)、效率最高、用途最廣泛的CPU集群

這些新推出和更新后的 CPU 構(gòu)成了 Arm  CPU 集群配置,為廣泛的消費(fèi)電子設(shè)備提供前所未有的性能、效率和廣泛用途。概括地說(shuō),與采用上一代 Cortex-X4 的 CPU 集群相比,新的 CPU 集群的 AI 性能提高了 46%,能實(shí)現(xiàn)了更高的響應(yīng)性能和持續(xù)的吞吐量。與 TCS23 CPU 集群相比,它使關(guān)鍵用戶(hù)體驗(yàn)指標(biāo)(結(jié)合性能與功耗)提高 30%,進(jìn)而加快應(yīng)用訪(fǎng)問(wèn)和網(wǎng)頁(yè)瀏覽速度,提升 AAA 游戲體驗(yàn),并延長(zhǎng)電池使用壽命。

最新的 Arm CPU 集群還可為各類(lèi)的消費(fèi)電子設(shè)備提供出色的擴(kuò)展能力。例如,它為 PC 和筆記本電腦提供一流的性能,與當(dāng)前發(fā)售的 PC 和筆記本電腦設(shè)備相比,性能提高了 25%。同時(shí),與 TCS23 中的 DSU-120 相比,功耗和面積均獲得降低,加上通過(guò) Cortex-A725 和 Cortex-A520 帶來(lái)的面積和功耗優(yōu)化,為主流設(shè)備提供了靈活的 CPU 集群配置組合。這有助于在各類(lèi)低成本的消費(fèi)電子設(shè)備上提供優(yōu)異性能和 AI 功能,確保日常設(shè)備用戶(hù)能夠獲得高級(jí)的 AI 體驗(yàn)。

1718273692381891.png

Armv9 CPU面向新一代AI體驗(yàn)

新的 Armv9.2 CPU 集群為安卓智能手機(jī)、PC 和筆記本電腦等設(shè)備提供出色的性能與用戶(hù)體驗(yàn)。該集群提供一整套實(shí)際用例的改進(jìn),集群中各個(gè) CPU 組件均涵蓋廣泛的實(shí)際用例和工作負(fù)載。例如,Cortex-X925 可處理應(yīng)用啟動(dòng)和網(wǎng)頁(yè)瀏覽的“突發(fā)”工作負(fù)載,Cortex-A725 可提供常見(jiàn) AI 工作負(fù)載和 AAA 游戲所需的持續(xù)性能,Cortex-A520 的高效率則非常適合輕量型媒體和閑置及后臺(tái)任務(wù)。所有這些增強(qiáng)的實(shí)際用例體驗(yàn)都可以擴(kuò)展到各類(lèi)消費(fèi)技術(shù)領(lǐng)域,新推出的 Armv9 CPU 為主流設(shè)備和日常用戶(hù)帶來(lái)了更高的性能和更強(qiáng)大的 AI 功能,從而使關(guān)鍵用戶(hù)體驗(yàn)指標(biāo)提高 30%。

隨著用戶(hù)在其設(shè)備上花費(fèi)的時(shí)間不斷增多,并期望獲得更高級(jí)的體驗(yàn),消費(fèi)者對(duì)技術(shù)的需求永無(wú)止境。無(wú)論是更快的網(wǎng)頁(yè)瀏覽和應(yīng)用訪(fǎng)問(wèn)速度,還是增強(qiáng)的 AAA 游戲與生成式 AI 工作負(fù)載,新的 Armv9 CPU 通過(guò)先進(jìn)的計(jì)算功能提升各類(lèi)體驗(yàn),進(jìn)而定義消費(fèi)技術(shù)的未來(lái)。



關(guān)鍵詞: Armv9 移動(dòng)設(shè)備

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉