高通罕見公布驍龍X GPU架構細節(jié)：性能超67％、功耗低62％

作者：時間：2024-06-17 來源：快科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

6月16日消息，高通驍龍?zhí)幚砥饕恢睋碛袠O其強大的GPU性能，常被調(diào)侃為“買GPU送CPU”，但官方對于GPU架構的技術細節(jié)一直諱莫如深，每次只說支持XX技術、性能提升XX。

本文引用地址：http://2s4d.com/article/202406/459927.htm

到了最新的驍龍X Elite/Plus系列處理器上，或許是為了更好地對標Intel、AMD，高通空前大方地公開了Adreno X1 GPU的底層細節(jié)，頂級型號為Adreno X1-85。

高通罕見公布驍龍X GPU架構細節(jié)：性能超67％、功耗低62％

Adreno X1是專門針對Windows PC設計的，圖形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0，都有原生驅動支持。

FP32單精度浮點性能最高4.6TFlops(每秒4.6萬億次計算)，像素填充率最高72Gp/s(每秒720億次)。

高通罕見公布驍龍X GPU架構細節(jié)：性能超67％、功耗低62％

如此詳細的架構圖對于高通GPU來說似乎還是第一次，可以看到分為6個著色處理器(SP)，整體共計1536個FP32 ALU，可以通俗地表達為1536個核心，最高頻率1.5GHz。

粗暴地按照核心數(shù)計算，這相當于GTX 1660 Ti，或者說三個Arc A770，或者說四分之三個RX 7600。

渲染前端模塊支持每時鐘周期2個三角形和光柵化處理、雙向LRZ(地分辨率深度測試)、基于圖像的可變著色率(VSR Tie2)。

還有專門用于分箱(binning)的前端模塊，與渲染同步運行。

6個SP對應6個渲染后端，每時鐘周期最多48個像素、96個fragment(用于MSAA抗鋸齒)。

另外還有GMU，也就是GPU管理單元，完整支持虛擬化(最多8個虛擬機)，還有電源管理的作用。

高通罕見公布驍龍X GPU架構細節(jié)：性能超67％、功耗低62％

細看SP部分，也就是SIMD著色處理器，屬于核心執(zhí)行模塊，分為兩個uSPTP(微型著色與紋理流水線)。

整個SP，分布著256個FP32 ALU(單精度浮點算術邏輯單元)，支持FP32/16、INT32/16、BF16數(shù)據(jù)類型，支持DP4ACC指令(四路INT8點積)，以及512個FP16 ALU(半精度浮點算術邏輯單元)，支持FP16、INT16、BF16數(shù)據(jù)類型。

此外，還有32個32位EFU(基本功能單元)、384KB GPR(通用寄存器)、指令緩存、本地緩沖、載入/存儲單元、紋理流水線和紋理緩存、GMEM單元，等等。

高通罕見公布驍龍X GPU架構細節(jié)：性能超67％、功耗低62％