博客專欄

EEPW首頁 > 博客 > Arm發(fā)布全新CPU: Cortex X925、A725 和A520

Arm發(fā)布全新CPU: Cortex X925、A725 和A520

發(fā)布人:旺材芯片 時間:2024-05-30 來源:工程師 發(fā)布文章

隨著半導體行業(yè)的不斷發(fā)展,Arm 通過突破技術界限,為終端用戶提供尖端解決方案,在核心和 IP 架構創(chuàng)新方面處于領先地位,尤其是在移動領域。2024 年,Arm 的年度戰(zhàn)略進步重點是增強去年的 Armv9.2 架構,并帶來新的變化。Arm 已重新打造品牌并重新制定戰(zhàn)略,推出了客戶端計算解決方案 (CSS:Client Compute Solutions),這是去年整體計算解決方案 (TSC2023) 平臺的直接繼任者。


Arm 還在將其最新的 IP 和 Cortex 核心設計(包括最大的 Cortex X925、中間的 Cortex A725 以及更新的較小 Cortex A520)過渡到更先進的 3 nm 工藝技術。Arm 承諾,與去年的設計相比,3 nm 工藝節(jié)點將提供前所未有的性能提升、能效和可擴展性改進,以及對其 Cortex 系列核心的新前端和后端改進。Arms 的新解決方案有望為下一代移動和 AI 應用程序提供支持,因為 Arm 及其完整的 AArch64 64 位指令執(zhí)行和面向移動和筆記本電腦的解決方案方法有望重新定義最終用戶對 Arm 產品上的 Android 和 Windows 的期望。


Arm 客戶端計算解決方案 (CSS):CSS 是新的 TCS


客戶端計算解決方案 (CSS) 的推出標志著 Arm 戰(zhàn)略的一個重要里程碑,該戰(zhàn)略旨在為合作伙伴提供全面而全面的計算解決方案,供其在新一年的移動設備周期中實施。CSS 是一個綜合平臺,集成了硬件、軟件和工具,以優(yōu)化客戶端設備的性能和效率。它旨在為各種設備(從智能手機和平板電腦到筆記本電腦甚至臺式電腦)提供無縫的計算體驗。


Armv9.2 架構于去年推出,代表著 Arm 路線圖向前邁出了重要一步。不過,今年,Arm 將在前代產品成功的基礎上,引入一系列新功能和改進。改進后的 Armv9.2 系列的主要亮點之一是使用增強的安全功能,包括內存標記擴展 (MTE:memory tagging extensions ) 和機密計算架構 (CCA:confidential compute architecture)。這些功能可針對各種安全威脅提供強大的保護,使設備更加安全。


圖片


CSS 利用為 2024 年設計的最新 Armv9.2 內核,包括高性能 Cortex X925、均衡的 Cortex A725 以及節(jié)能且更新的 Cortex A520。這些內核與 Arm 的全新 Immortalis G925 GPU 相得益彰,旨在以移動設備大小的封裝提供卓越的圖形性能和效率。這些組件共同構成了現(xiàn)在所謂的 CSS 平臺的基礎,該平臺旨在為移動領域的現(xiàn)代設備提供強大而多功能的計算解決方案。


CSS 的主要特點之一是其強大的可擴展性,可適應不同的市場,例如移動設備和筆記本電腦。該平臺旨在適應不同的設備外形和性能要求,適合多種任務和應用。無論是高端游戲、專業(yè)內容創(chuàng)作還是日常生產力任務,CSS 都可以根據各種用例的需求進行定制。


Arm 的客戶端計算解決方案 (CSS) 平臺代表著 IP 設計和架構改進方面邁出了重要一步,在性能和效率方面提供了多項重大改進。隨著第二代 Armv9.2 Cortex CPU 集群的推出,包括新的 Cortex-X925(大)、Cortex-A725(中)和更新的 Cortex-A520(?。﹥群?,CSS 平臺旨在授權給合作伙伴時提供極致的移動計算性能。


圖片


此外,CSS 平臺還包括適用于 Android 的全面參考軟件堆棧、由新的 Arm 計算機視覺庫(KleidiAI 和 KleidiCV)支持的優(yōu)化 AI,以及通過 Arm Performance Studio 提供的強大工具環(huán)境。這種典型的整體方法可確保 Arm 的物理實現(xiàn)達到 3.6 GHz 以上的速度,并在 3 nm 節(jié)點上提供最佳的功率、性能和面積 (PPA) 指標。談到 3 nm 模式,Arm 表示臺積電和三星 3 nm 是其 CSS 核心集群的主要選擇,盡管最有可能的是與臺積電一起獲得晶圓廠分配的情況,因為我們不確定是否有人會使用三星而不是臺積電。


除了安全性增強之外,基于 3 nm 的 Armv9.2 還承諾大幅提升性能,尤其是新的大核心 Cortex X925,Arm 認為它是移動領域的新 IPC 之王。該架構已針對更高的時鐘速度和更高的效率進行了優(yōu)化,從而可以提供更高的每瓦計算能力。這是通過多項架構創(chuàng)新實現(xiàn)的,包括更寬的執(zhí)行管道、改進的分支預測和增強的亂序執(zhí)行功能。這些增強功能提高了內核的每周期指令數 (IPC),確保它們可以輕松處理最苛刻的工作負載。


過渡到 3 納米工藝技術


轉向 3 納米工藝技術代表著半導體制造的重大飛躍,在性能、功耗和芯片密度方面均有顯著改善。這一轉變使 Arm 能夠提供更強大、更高效的處理器,能夠高效處理最苛刻的應用程序。


3 nm 工藝的主要優(yōu)勢之一是它能夠在更小的面積內封裝更多晶體管,從而提高性能并降低功耗。這對于移動和便攜式設備至關重要,因為電池壽命和熱管理是關鍵考慮因素。3 nm 工藝還使 Arm 能夠在 Cortex X925 內核上提高時鐘速度,確切地說最高可達 3.8 GHz。這可以實現(xiàn)更快、響應更快的計算體驗,并將整體 IPC 性能推向超越現(xiàn)有水平。


圖片


Arm 聲稱,更新后的 Armv9.2 架構、全新 CSS 平臺以及 3 納米制程技術的結合,旨在全面提升性能和效率。從理論上講,這應該能夠為所有類型的設備實現(xiàn)其參考 CPU 核心集群設計,現(xiàn)在兩個 Cortex X 核心已成為常態(tài),而去年的參考設計只有一個。Arm 進行并展示的基準測試和實際測試(不應全盤接受)顯示,單線程和多線程性能都有了顯著提升,使得這些新解決方案成為各種應用的理想選擇。Arm 甚至宣稱,其最大核心 Cortex X925 在單線程 IPC 方面處于領先地位,超越了英特爾和 AMD 的產品,這是一個大膽的說法。


至于電源效率,新內核旨在提供更高的每瓦計算能力,從而降低能耗并延長電池壽命。這對于移動設備來說尤其重要,因為用戶需要更長的電池壽命,同時又不影響性能。電源效率的提高還意味著更好的熱管理,確保設備即使在繁重的工作負載下也能保持涼爽和響應迅速。


圖片


除了性能和效率的提升,新解決方案還帶來了增強的安全性和AI功能。Armv9.2架構的內存標記擴展(MTE)和機密計算架構(CCA)可針對各種安全威脅提供強大的保護,確保數據和應用程序的安全。


新內核和 GPU 增強的 AI 功能也值得關注。隨著 AI 在現(xiàn)代應用中的重要性日益提高,新解決方案旨在加速 AI 工作負載,提供更快、更高效的 AI 處理。這是通過專用的 AI 加速器和優(yōu)化來實現(xiàn)的,這些加速器和優(yōu)化充分利用了新架構和工藝技術的潛力。


圖片


工藝技術向 3 nm 遷移為半導體制造帶來了許多機遇和挑戰(zhàn)。對于軟 IP,更大、更復雜的微架構需要更強的電壓調節(jié)和緩解功能,以確保穩(wěn)定性和性能。關鍵目標是優(yōu)化目標節(jié)點上的正確 PPA(功率、性能、面積)。對于物理 IP,工藝復雜性帶來了自身的挑戰(zhàn),包括擴展限制和支持更寬動態(tài)電壓和頻率縮放 (DVFS) 頻譜的要求。此外,在極端功率密度下,這應該可以緩解熱問題,并確保設備高效運行,這在移動設備中非常重要


為了應對這些挑戰(zhàn),Arm 全面審視 RTL 和物理實現(xiàn)的共同開發(fā)。這確保了其計算 IP 能夠滿足性能預期,同時克服先進工藝技術的挑戰(zhàn)。


Armv9.2、CSS 和 3 nm 技術的進步為各種應用開辟了新的可能性,包括開發(fā)人員訪問新的 Arm Kleidi 庫。在移動領域,這些解決方案使更強大、更高效的智能手機和平板電腦能夠處理復雜的任務,例如 AI 驅動的攝影、游戲和生產力。


新的解決方案以便攜式外形尺寸為 PC 市場提供臺式機級性能,使其成為筆記本電腦和二合一設備的理想選擇。改進的性能和效率也有利于專業(yè)內容創(chuàng)作,從而實現(xiàn)更快的渲染、編輯和多任務處理。


圖片


在人工智能和機器學習領域,新解決方案提供了高級人工智能應用所需的計算能力,從自然語言處理和計算機視覺到自主系統(tǒng)和機器人技術。增強的人工智能功能可確保這些應用程序高效運行,從而提供更快、更準確的結果。


隨著 Arm 不斷突破半導體技術的界限,專注于增強 Armv9.2 架構、推出 CSS 平臺以及過渡到 3 nm 工藝技術標志著向前邁出了重要一步。這些進步大大提高了性能、能效和安全性,使新一代設備能夠輕松處理最苛刻的應用程序。


圖片


結合這些技術,我們能夠提供強大且多功能的計算解決方案,該解決方案可以擴展到不同的設備外形和用例。無論是高端游戲、專業(yè)內容創(chuàng)作還是日常生產力任務,Arm 的最新解決方案都旨在提供最佳的計算體驗。


好的硬件得益于好的軟件


Arm 硬件的進步得益于一個復雜的軟件生態(tài)系統(tǒng),該生態(tài)系統(tǒng)旨在充分發(fā)揮其處理器的潛力。這個生態(tài)系統(tǒng)的核心是新的 Kleidi 庫,它在優(yōu)化人工智能 (AI) 和基于計算機的應用程序方面發(fā)揮著至關重要的作用。這些庫為開發(fā)人員提供了量身定制的工具,以最大限度地提高 Arm 最新內核的性能和效率。


圖片


KleidiAI 是專注于加速 AI 工作負載的關鍵組件。它包括一套針對 Arm 架構優(yōu)化的全面計算內核,能夠高效執(zhí)行各種 AI 任務,例如機器學習、自然語言處理和數據分析。通過為常見的 AI 操作提供高度優(yōu)化的例程,KleidiAI 可讓開發(fā)人員在保持能源效率的同時實現(xiàn)顯著的性能提升。隨著 AI 應用在移動設備、智能家居系統(tǒng)和工業(yè)自動化中變得越來越普遍,這一點變得越來越重要。


圖片


另一方面,KleidiCV 則針對計算機視覺工作負載。該庫為圖像處理、對象檢測和場景識別等任務提供了優(yōu)化的功能。將 KleidiCV 與 Arm 的架構集成可確保應用程序能夠快速高效地處理視覺數據,使其成為增強現(xiàn)實、自動駕駛汽車和智能監(jiān)控系統(tǒng)的理想選擇。通過利用這些優(yōu)化的庫,開發(fā)人員可以構建在基于 Arm 的硬件上流暢運行的復雜應用程序,充分利用 3 nm 工藝技術帶來的性能和能效改進。


除了 Kleidi 庫之外,Arm 還提供了一套強大的開發(fā)工具和平臺??蛻舳擞嬎憬鉀Q方案 (CSS) 平臺包括參考軟件堆棧和性能優(yōu)化工具,如 Arm Performance Studio,它提供有關應用程序性能的詳細見解,并幫助開發(fā)人員微調其軟件以實現(xiàn)最高效率。這個全面的支持系統(tǒng)確保開發(fā)人員能夠快速有效地將創(chuàng)新應用程序推向市場,充分利用 Arm 最新的架構進步。


在接下來的幾頁中,我們將分解 Arm 在其 2024 CPU 集群中的改進,包括新的 Cortex X925 和 Cortex A725 內核以及使用最小內核 Cortex A520 所做的改進。


Arm Cortex X925:引領單線程 IPC 的發(fā)展


Arm Cortex-X925 代號為“Black Hawk”,Arm 宣稱,它處于單線程每時鐘指令 (IPC) 性能的最前沿,至少從 Arm 的說法來看,它在很大程度上為提高性能和效率奠定了基礎。該核心是 Arm 轉向 3 nm 工藝節(jié)點的關鍵部分,并與第二代 Armv9.2 架構無縫集成。如果 Arms 的說法屬實,那么 Cortex X925 將成為高性能移動計算領域的領導者,也是 Arm 及其對高效 PPA 的關注是 Arm 2024 CPU 核心集群驅動力的一個例子。


圖片


Cortex-X925 的架構改進旨在最大程度地提高 IPC。其突出特點之一是 10 寬的解碼和調度寬度,大大增加了每個周期處理的指令數量。這一增強功能使內核能夠同時執(zhí)行更多指令,從而提高執(zhí)行單元的利用率和整體吞吐量。


Arm 將指令窗口大小增加了一倍,以支持這種寬指令路徑,從而允許在任意給定時間執(zhí)行更多指令。這減少了停頓并提高了執(zhí)行管道的效率。此外,該內核的 L1 指令緩存 (I$) 帶寬增加了 2 倍,L1 指令轉換后備緩沖區(qū) (TLB) 大小也增加了類似倍數。這些增強功能確保內核可以快速獲取和解碼指令,從而最大限度地減少延遲并最大限度地提高性能。


圖片


Cortex-X925 還具有高度先進的分支預測單元,可減少錯誤預測的分支數量。通過采用折疊式無條件直接分支等技術,Arm 消除了多個架構障礙,從而實現(xiàn)了更精簡、更高效的執(zhí)行路徑。這可以減少管道刷新次數并提高持續(xù) IPC 水平。


圖片


Arm Cortex-X925 的前端展示了設計中的大量改進,包括提高指令吞吐量和減少延遲。這些改進的核心是 10 寬的解碼和調度寬度,與以前的架構相比,這使內核能夠在每個周期處理更多指令。這種寬指令路徑增加了指令處理的并行性,使內核能夠同時執(zhí)行更多任務。


此外,Cortex-X925 的指令窗口大小增加了一倍,可容納更多指令并最大限度地減少流水線停頓。L1 指令緩存 (I$) 帶寬也增加了 2 倍,同時 L1 指令轉換后備緩沖區(qū) (iTLB) 大小也進行了類似的擴展。這些增強功能確保內核能夠快速獲取和解碼指令,從而顯著減少獲取瓶頸并提高整體性能。


圖片


Cortex-X925 后端的亂序 (OoO) 執(zhí)行能力顯著提升,增幅達 25-40%。這一提升使內核能夠更靈活、更高效地執(zhí)行指令,從而減少空閑時間并提高整體性能。此外,內核的寄存器文件結構也得到了增強,增加了重新排序緩沖區(qū)大小和指令發(fā)出隊列,最終有助于更順暢、更快速地執(zhí)行指令。


圖片


盡管性能出色,Cortex-X925 的設計也注重節(jié)能。3 nm 工藝技術至關重要,可實現(xiàn)比前幾代產品更好的節(jié)能效果。內核的設計包括動態(tài)電壓和頻率調節(jié) (DVFS) 等功能,可根據工作負載調整功率和性能水平。這可確保高效利用能源,延長電池壽命并減少熱量輸出。


Cortex-X925 還集成了先進的電源管理功能,例如每核 DVFS 和改進的電壓調節(jié)。這些功能有助于更有效地管理功耗,確保內核在不影響能效的情況下提供高性能。這種平衡對于需要持續(xù)性能和長電池壽命的移動設備尤其有益。


圖片


Cortex-X925 還針對基于 AI 的工作負載進行了設計和優(yōu)化,具有專用的 AI 加速器和軟件優(yōu)化,可提高 AI 處理效率。憑借高達 80 TOPS(每秒萬億次操作),該內核可以處理從自然語言處理到計算機視覺的復雜 AI 任務。這些功能得到了 Arm 的 Kleidi AI 和 Kleidi CV 庫的進一步支持,這些庫為開發(fā)人員提供了構建高級 AI 應用程序所需的工具。


有趣的是,Arm 本身并未涉足 NPU 或 AI 加速器領域。相反,它允許其合作伙伴(如聯(lián)發(fā)科)整合自己的產品,以確保核心集群能夠提供必要的支持和集成功能。憑借其參考軟件堆棧和優(yōu)化庫,CSS 平臺為開發(fā)人員提供了堅實的基礎。全面的 Arm Performance Studio 提供了先進的工具環(huán)境,可幫助開發(fā)人員針對新架構優(yōu)化其應用程序。


CSS 平臺通過其重新煥發(fā)活力的 Windows on Arm OS 與 Android、Linux 變體和 Windows 等操作系統(tǒng)集成,確保了廣泛的兼容性和易于開發(fā)。這種跨操作系統(tǒng)支持使開發(fā)人員能夠快速高效地構建利用 Cortex-X925 功能的應用程序,以及整個更新的 Armv9.2 核心集群,這不僅可以加快上市時間,還可以確??缍喾N設備的兼容性。


Arm Cortex A725:中核效率的提升


Arm Cortex-A725 旨在平衡性能和能效,是第二代 Armv9.2 架構的關鍵組件。它定位為中端內核,與高性能 Cortex-X925 相得益彰,為日常計算任務提供強大的功能,同時保持能效。該內核特別針對需要穩(wěn)定性能但又不需要頂級內核高功耗的設備,例如智能手機、平板電腦和筆記本電腦。


圖片


Cortex-A725 在其前身 Cortex-A720 的成功基礎上進行了多項關鍵架構改進。其中一項重大改進是增加了指令發(fā)布隊列和擴展了重新排序緩沖區(qū),這使得內核能夠同時處理更多指令并亂序執(zhí)行這些指令以提高效率。亂序執(zhí)行窗口大小的增加使 Cortex-A725 能夠更好地利用其執(zhí)行單元,從而更順暢、更快地處理復雜的工作負載。


該內核還受益于新的 1MB L2 緩存配置,可更快地訪問常用數據和指令。這種更大的緩存大小旨在減少延遲并提高性能,特別是對于需要快速數據檢索的應用程序。此外,Cortex-A725 的寄存器文件結構也得到了增強,進一步簡化了數據處理并減少了瓶頸。


圖片


能效是 Cortex-A725 設計的一個關鍵方面。隨著領先的 2024 Cortex 芯片預計將采用臺積電等公司最新推出的 3nm 工藝技術制造,這些節(jié)點的改進性能能夠推動能效的大幅提升,而 Arm 在 A725 中也大量采用了這一點。總體而言,Arm 宣稱 A725 與前幾代產品相比可顯著節(jié)省電量。與 Cortex-A720 相比,Cortex-A725 的能效提高了 25%(L3 流量減少了 20%),使其成為需要長電池壽命的移動設備的理想選擇。


圖片


該內核還具有先進的電源管理功能,包括動態(tài)電壓和頻率調節(jié) (DVFS) 和half-slice斷電模式。這些功能允許 Cortex-A725 根據當前工作負載調整其功耗,確保高效利用能源而不犧牲性能。


Arm Cortex A520:相同的 2023 核心,針對 3 nm 進行了優(yōu)化


Arm Cortex-A520 在架構上并沒有什么不同,與去年推出的 TCS2023 相比也沒有變化。相反,它針對最新的 3 nm 工藝技術進行了優(yōu)化,提高了效率和性能。該內核是第二代 Armv9.2 架構的一部分,可為移動和嵌入式設備中的日常任務提供一些額外的計算能力,同時保持峰值能效并降低 Arm 最小內核的預期功耗。


這些架構調整確保 Cortex-A520 可以最大限度地發(fā)揮 3 nm 工藝的潛力,實現(xiàn)更高的晶體管密度和更好的整體性能,而無需對其基本設計進行任何重大更改。


圖片


與 Cortex-A520 (TCS23) 相比,Cortex-A520 的節(jié)能效果顯著,達到 15%。這一改進對于電池續(xù)航時間較長的設備(如智能手機和物聯(lián)網 (IoT) 設備)至關重要。通過優(yōu)化功耗,Cortex-A520 可確保高效性能,同時又不影響能耗。


上圖清晰地說明了 Cortex-A520 與其前代產品 Cortex-A55 和之前的 Cortex-A520 (TCS23) 相比的功率和性能關系。專為 3 nm 設計的最新 Cortex-A520 顯著提高了各個性能級別的功率效率。這意味著 Cortex-A520 在給定性能點上消耗的功率顯著降低,表明 Arm 致力于在 2024 年的核心集群中提供性能提升,并專注于從功率角度對三個 Cortex 核心中最小的一個進行改進。


2024 年推進 3 納米技術


總體而言,Arm 面向客戶端 PC 的 CSS 依賴于兩個超高性能 Arm  Cortex-X925 通用內核(每個內核高達 3MB L2 緩存,時鐘頻率超過 3.60 GHz,支持 SVE、SVE2)、四個高性能 Cortex-A725 內核、兩個節(jié)能 Cortex-A520 內核和一個 Immortalis-G925 圖形處理器。Arm 最新的 CSS 最多可支持 14 個 CPU 內核。CSS 是一種可用于生產的物理實現(xiàn),可在 3nm 工藝技術上制造(可能是臺積電的 N3E——盡管這只是猜測)。


Arm CSS 實現(xiàn)的實際規(guī)格可能會由處理器供應商更改以滿足其性能和功率目標,但 Arm 用于性能評估的 FPGA 包括 Cortex-X925 內核(2 MB L2,3.80 GHz)、16MB L3、32MB 系統(tǒng)級緩存、2 GHz 的 DSU 和 LPDDR5X-8533 內存。


Arm 客戶業(yè)務線高級副總裁兼總經理 Chris Bergey 表示:“我們現(xiàn)在在 Arm、CPU 和 GPU 上提供物理實現(xiàn),使構建和部署基于 Arm 的解決方案變得更加容易,并且不會留下任何意外,從而實現(xiàn)新的性能點和計算能力,并幫助加快產品上市時間。”


“Arm 正在提供更多價值,與領先的代工合作伙伴合作,針對新的 3nm 工藝節(jié)點優(yōu)化整個堆棧。這使我們能夠以物理形式提供 IP??蛻舳?CSS 將物理實現(xiàn)與 Armv9 架構在 AI 方面的優(yōu)勢結合在一起?!?Bergey說。


Arm 表示,Geekbench 6 單核得分與 TCS23 相比,Cortex-X925 CPU 的峰值性能提升了 36%。它還將前 10 個應用程序中的 5 個應用程序的啟動時間平均縮短了 33%,從而提高了工作效率,并在移動設備上提供了更流暢的用戶體驗。此外,根據 Speedometer 2.1 基準測試,它的網頁瀏覽速度提高了 60%,并在包括光線追蹤和可變速率著色 (VRS) 在內的七個圖形基準測試中將峰值圖形性能平均提高了 30% 。


與 Cortex-X4 相比,新的 Cortex-X925 平臺在使用旨在加速現(xiàn)代 Arm CPU 上的 AI 應用的 KleidiAI 庫時,在 LLaMA 3(80 億個參數)中性能提升高達 42%,在 Phi 3(38 億個參數)AI 模型中性能提升高達 46%。


圖片


從這次發(fā)布會我們可以看到,Arm選擇在2024 年改進和完善其IP,而不是完全重新定義并做出突破性的改變。繼去年推出 Armv9.2 系列內核之后,Arm 在 2024 年的最新 Cortex 系列架構中做出了一些顯著改變,明確且有意轉向更先進的 3 nm 工藝節(jié)點,三星和臺積電 3 nm 均作為 2024 年平臺基于客戶端的 CSS 的基礎。


Cortex-X925、Cortex-A725 和 Cortex-A520 內核已針對 3 nm 工藝進行了優(yōu)化,顯著提升了性能和能效。Cortex-X925 的解碼和調度寬度增強了 10 倍,時鐘速度提高到 3.8 GHz,有望為單線程 IPC 性能樹立新標準。Arm 更新后的 v9.2 平臺非常適合高性能應用,包括 AI 工作負載和高端游戲,無論是在移動領域還是在 Microsoft 的 Windows on Arm 生態(tài)系統(tǒng)中。


從總體來看,從 Arm 對新 CSS 平臺和去年的 TCS2023 版本的內部性能比較來看,Arm 聲稱性能提升了 30% 到 60%,具體取決于任務和工作量。如果這是可信的,那么性能改進是令人難以置信的,而向 3 nm 的過渡可能是性能的主要改進因素,而不是底層架構的改進。


圖片


Cortex-A725 在性能和效率之間取得平衡,使其適用于多種中端設備。得益于增加緩存大小和擴展重新排序緩沖區(qū)等架構增強功能,Arm 聲稱這些改進比上一代產品實現(xiàn)了高達 35% 的性能效率。更新后的 Cortex-A520 主要側重于在 3 nm 節(jié)點上進行優(yōu)化,同時力求保持無與倫比的能效,與上一代產品相比,實現(xiàn)了 15% 的節(jié)能。該核心針對低強度工作負載進行了優(yōu)化,使其成為物聯(lián)網設備和低成本智能手機等對功耗敏感的應用的理想選擇。


AI 功能一直是 Arm 最新產品的重要關注點。Cortex-X925 和 Cortex-A725 內核主要集成專用 AI 加速器,允許訪問優(yōu)化的軟件庫(例如 KleidiAI 和 KleidiCV),從而確保高效的 AI 處理。這些增強功能對于從神經語言模型到 LLM 等各種應用都至關重要。


圖片


Arm 還繼續(xù)通過由新 CSS 平臺驅動的、通常熟練且全面的生態(tài)系統(tǒng)支持其最新的核心集群,該生態(tài)系統(tǒng)與 Arm Performance Studio 以及 Kleidi AI 和 CV 庫相結合。這些提供的工具為開發(fā)人員提供了充分利用新架構功能的強大基礎。這有效地縮短了整體上市時間,并促進了各個行業(yè)的創(chuàng)新,例如內容創(chuàng)建和設備上的 AI 推理。CSS 平臺與 Android、Linux 和 Windows(Arm 上的 Windows)等操作系統(tǒng)的集成確保了更大的采用范圍。它推動了更廣泛的開發(fā)水平,使軟件和應用程序可以在比前幾代更多的設備上使用。


總而言之,Arm 將其所有最新 CPU 設計都轉向 3 nm 工藝技術,并對 Cortex-X925 和 Cortex-A725 內核進行改進,表明其戰(zhàn)略重點是優(yōu)化現(xiàn)有架構,而不是進行徹底的改變。這些改進包括增加每個內核的緩存大小、轉向更寬的管道,以及為 2024 年增強 DSU-120 內核集群,這無疑在紙面上帶來了顯著的性能和能效提升。


在使新設備能夠處理要求苛刻的應用程序的同時,這些效率和性能方面的改進大多是在轉向更先進但更具挑戰(zhàn)性的 3 納米節(jié)點時實現(xiàn)的。隨著 Arm 繼續(xù)突破其 IP 的極限,這些技術應該為更強大、更高效、更智能的設備鋪平道路,塑造移動設備未來的可能性和能力,無論是新一代支持 AI 的設備還是移動游戲,Arm 都希望提供這一切。


來源:半導體行業(yè)觀察


*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: Arm

相關推薦

技術專區(qū)

關閉