高通罕見(jiàn)公布驍龍X GPU架構(gòu)細(xì)節(jié)：性能超67％、功耗低62％

作者：時(shí)間：2024-06-17 來(lái)源：快科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

6月16日消息，高通驍龍?zhí)幚砥饕恢睋碛袠O其強(qiáng)大的GPU性能，常被調(diào)侃為“買GPU送CPU”，但官方對(duì)于GPU架構(gòu)的技術(shù)細(xì)節(jié)一直諱莫如深，每次只說(shuō)支持XX技術(shù)、性能提升XX。

本文引用地址：http://m.butianyuan.cn/article/202406/459927.htm

到了最新的驍龍X Elite/Plus系列處理器上，或許是為了更好地對(duì)標(biāo)Intel、AMD，高通空前大方地公開(kāi)了Adreno X1 GPU的底層細(xì)節(jié)，頂級(jí)型號(hào)為Adreno X1-85。

高通罕見(jiàn)公布驍龍X GPU架構(gòu)細(xì)節(jié)：性能超67％、功耗低62％

Adreno X1是專門針對(duì)Windows PC設(shè)計(jì)的，圖形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0，都有原生驅(qū)動(dòng)支持。

FP32單精度浮點(diǎn)性能最高4.6TFlops(每秒4.6萬(wàn)億次計(jì)算)，像素填充率最高72Gp/s(每秒720億次)。

高通罕見(jiàn)公布驍龍X GPU架構(gòu)細(xì)節(jié)：性能超67％、功耗低62％

如此詳細(xì)的架構(gòu)圖對(duì)于高通GPU來(lái)說(shuō)似乎還是第一次，可以看到分為6個(gè)著色處理器(SP)，整體共計(jì)1536個(gè)FP32 ALU，可以通俗地表達(dá)為1536個(gè)核心，最高頻率1.5GHz。

粗暴地按照核心數(shù)計(jì)算，這相當(dāng)于GTX 1660 Ti，或者說(shuō)三個(gè)Arc A770，或者說(shuō)四分之三個(gè)RX 7600。

渲染前端模塊支持每時(shí)鐘周期2個(gè)三角形和光柵化處理、雙向LRZ(地分辨率深度測(cè)試)、基于圖像的可變著色率(VSR Tie2)。

還有專門用于分箱(binning)的前端模塊，與渲染同步運(yùn)行。

6個(gè)SP對(duì)應(yīng)6個(gè)渲染后端，每時(shí)鐘周期最多48個(gè)像素、96個(gè)fragment(用于MSAA抗鋸齒)。

另外還有GMU，也就是GPU管理單元，完整支持虛擬化(最多8個(gè)虛擬機(jī))，還有電源管理的作用。

高通罕見(jiàn)公布驍龍X GPU架構(gòu)細(xì)節(jié)：性能超67％、功耗低62％

細(xì)看SP部分，也就是SIMD著色處理器，屬于核心執(zhí)行模塊，分為兩個(gè)uSPTP(微型著色與紋理流水線)。

整個(gè)SP，分布著256個(gè)FP32 ALU(單精度浮點(diǎn)算術(shù)邏輯單元)，支持FP32/16、INT32/16、BF16數(shù)據(jù)類型，支持DP4ACC指令(四路INT8點(diǎn)積)，以及512個(gè)FP16 ALU(半精度浮點(diǎn)算術(shù)邏輯單元)，支持FP16、INT16、BF16數(shù)據(jù)類型。

此外，還有32個(gè)32位EFU(基本功能單元)、384KB GPR(通用寄存器)、指令緩存、本地緩沖、載入/存儲(chǔ)單元、紋理流水線和紋理緩存、GMEM單元，等等。

高通罕見(jiàn)公布驍龍X GPU架構(gòu)細(xì)節(jié)：性能超67％、功耗低62％