新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > 高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

作者: 時(shí)間:2024-06-17 來源:快科技 收藏

6月16日消息,驍龍?zhí)幚砥饕恢睋碛袠O其強(qiáng)大的性能,常被調(diào)侃為“買送CPU”,但官方對于架構(gòu)的技術(shù)細(xì)節(jié)一直諱莫如深,每次只說支持XX技術(shù)、性能提升XX。

本文引用地址:http://m.butianyuan.cn/article/202406/459927.htm

到了最新的系列處理器上,或許是為了更好地對標(biāo)Intel、AMD,空前大方地公開了Adreno X1 GPU的底層細(xì)節(jié),頂級型號為Adreno X1-85。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

Adreno X1是專門針對Windows PC設(shè)計(jì)的,圖形接口完整支持DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0,都有原生驅(qū)動支持。

FP32單精度浮點(diǎn)性能最高4.6TFlops(每秒4.6萬億次計(jì)算),像素填充率最高72Gp/s(每秒720億次)。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

如此詳細(xì)的架構(gòu)圖對于GPU來說似乎還是第一次,可以看到分為6個(gè)著色處理器(SP),整體共計(jì)1536個(gè)FP32 ALU,可以通俗地表達(dá)為1536個(gè)核心,最高頻率1.5GHz。

粗暴地按照核心數(shù)計(jì)算,這相當(dāng)于GTX 1660 Ti,或者說三個(gè)Arc A770,或者說四分之三個(gè)RX 7600。

渲染前端模塊支持每時(shí)鐘周期2個(gè)三角形和光柵化處理、雙向LRZ(地分辨率深度測試)、基于圖像的可變著色率(VSR Tie2)。

還有專門用于分箱(binning)的前端模塊,與渲染同步運(yùn)行。

6個(gè)SP對應(yīng)6個(gè)渲染后端,每時(shí)鐘周期最多48個(gè)像素、96個(gè)fragment(用于MSAA抗鋸齒)。

另外還有GMU,也就是GPU管理單元,完整支持虛擬化(最多8個(gè)虛擬機(jī)),還有電源管理的作用。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

細(xì)看SP部分,也就是SIMD著色處理器,屬于核心執(zhí)行模塊,分為兩個(gè)uSPTP(微型著色與紋理流水線)。

整個(gè)SP,分布著256個(gè)FP32 ALU(單精度浮點(diǎn)算術(shù)邏輯單元),支持FP32/16、INT32/16、BF16數(shù)據(jù)類型,支持DP4ACC指令(四路INT8點(diǎn)積),以及512個(gè)FP16 ALU(半精度浮點(diǎn)算術(shù)邏輯單元),支持FP16、INT16、BF16數(shù)據(jù)類型。

此外,還有32個(gè)32位EFU(基本功能單元)、384KB GPR(通用寄存器)、指令緩存、本地緩沖、載入/存儲單元、紋理流水線和紋理緩存、GMEM單元,等等。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

GPU內(nèi)還集成了384KB集群緩存(每兩個(gè)SP共享128KB)、1MB一體化二級緩存、6MB系統(tǒng)級緩存(即三級緩存),還有一些其他較小的緩存,用于著色器指令、本地紋理數(shù)據(jù)等。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

GMEM是個(gè)特殊功能單元,也就是高帶寬的本地GPU顯存,容量3MB,帶寬達(dá)2TB/s,與系統(tǒng)內(nèi)存完全異步。

而且,它不僅僅是緩存,還可以全部或部分靈活地用于色彩與景深緩存、通用本地內(nèi)存,無論是圖形渲染還是通用計(jì)算都可以使用。

它可以讓GPU大大減少對系統(tǒng)內(nèi)存的依賴,降低對延遲和帶寬的需求,還有著超高的性能與能效。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

FlexRender彈性渲染技術(shù)也值得一提,可以由驅(qū)動控制,針對每一個(gè)不同的表面動態(tài)切換不同的渲染模式,提升性能的同時(shí)盡可能降低功耗。

具體分為三種模式:

一是Direct Mode,PC標(biāo)準(zhǔn)渲染方式,兼容性最好。

二是Binned Mode,將每一幀畫面切分為不同的區(qū)塊(Tile),每一個(gè)都都會進(jìn)入GMEM,可盡可能減少數(shù)據(jù)移動,提高能效。

三是Bined Direct Mode,前述兩種方式的混合。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

軟件方面,高通承諾每月升級GPU驅(qū)動,Adreno控制面板可調(diào)節(jié)性能和各項(xiàng)功能,而在兼容性方面已經(jīng)是數(shù)百款流行的Windows應(yīng)用,已測試的游戲均可查詢,還有豐富的開發(fā)工具。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

高通聲稱,Adreno X1對比酷睿Ultra的銳炫核顯,同等功耗下性能領(lǐng)先最多67%,同等行下功耗低最多62%!

對比銳龍9 7040系列中的Radeon 780M更是性能、能效都遙遙領(lǐng)先。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%

在流行的3A游戲中,官方列出了9款,都基本持平或者優(yōu)于Intel銳炫核顯,優(yōu)勢項(xiàng)目包括《地平線:零之曙光》、《火箭聯(lián)盟》等。

高通罕見公布驍龍X GPU架構(gòu)細(xì)節(jié):性能超67%、功耗低62%



關(guān)鍵詞: 高通 GPU 驍龍X Elite/Plus

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉