一顆萬能的RISC-V芯片: 將CPU和GPU整合到一個(gè)核中
X-Silicon Inc. (XSi) 創(chuàng)建了一種新的 RISC-V 微處理芯片架構(gòu),將 RISC-V CPU 內(nèi)核與矢量功能和 GPU 加速結(jié)合到單個(gè)芯片中。Jon Peddie Research 報(bào)告稱, CPU/GPU 混合芯片是開源的,它旨在處理各種不同的功能,包括通常由專用 CPU 和 GPU 處理的人工智能。問題是它應(yīng)該以更有效的方式完成這一切。
新的 CPU/GPU 混合處理器被設(shè)計(jì)為“萬能”處理器。據(jù) JPR 稱,業(yè)界一直在尋求一種開放標(biāo)準(zhǔn)的 GPU,其靈活性和可擴(kuò)展性足以支持各種市場(chǎng),包括虛擬現(xiàn)實(shí)、汽車和物聯(lián)網(wǎng)設(shè)備。這款新的 RISC-V CPU/GPU 旨在通過為制造商提供可以處理任何所需工作負(fù)載的單一開放芯片設(shè)計(jì)來解決這個(gè)問題。
X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計(jì)將 CPU 和 GPU 的功能結(jié)合到單核架構(gòu)中。這與 Intel 和 AMD 的典型設(shè)計(jì)不同,后者有獨(dú)立的 CPU 核心和 GPU 核心。相反,核心本身被設(shè)計(jì)用來處理 CPU 和 GPU 任務(wù)。從這個(gè)意義上說,這聽起來有點(diǎn)像英特爾放棄的 Larabee 項(xiàng)目,該項(xiàng)目試圖使用 x86 來處理圖形和其他工作負(fù)載。
該芯片采用X-Silicon 的 C-GPU 架構(gòu),將 GPU 加速合并到 RISC-V 矢量 CPU 核心中。該架構(gòu)具有帶有 32 位 FPU 和定標(biāo)器 ALU 的 RISC-V 矢量核心。它具有線程調(diào)度程序、剪輯引擎、光柵化器、紋理單元、神經(jīng)引擎和像素處理器。該芯片旨在處理包括人工智能、高性能計(jì)算(HPC)、幾何計(jì)算以及2D和3D圖形在內(nèi)的應(yīng)用。
理論上,X-Silicon的混合芯片能夠在同一內(nèi)核中處理CPU和GPU代碼,這為其帶來了許多優(yōu)勢(shì)。該芯片采用開源RISC-V ISA作為CPU和GPU,運(yùn)行單指令流。這提供了低內(nèi)存占用執(zhí)行和更高的效率,因?yàn)樵?CPU 內(nèi)存空間和 GPU 內(nèi)存空間之間無需復(fù)制數(shù)據(jù)。
CPU/GPU 內(nèi)核可以組合在一起形成多核設(shè)計(jì),使制造商能夠根據(jù)需要擴(kuò)展處理能力。在多核格式中,多個(gè)核心平鋪在一個(gè)芯片上,并使用快速結(jié)構(gòu)進(jìn)行連接。此設(shè)計(jì)中還實(shí)現(xiàn)了快速片上 SRAM 或 eDRAM 緩存,這些緩存用作可以聚合來自多個(gè)內(nèi)核的數(shù)據(jù)的 L2 緩存。每個(gè)核心都可以根據(jù)需要安排獨(dú)立于其他核心運(yùn)行圖形、AI、視頻、物理、HPC 或其他工作負(fù)載。
通過這種設(shè)計(jì),X-Silicon 的 C-GPU 架構(gòu)可以運(yùn)行任何類型的 CPU 或 GPU 工作負(fù)載。X-Silicon 聲稱已經(jīng)擁有與“融合 GPU 加速”配合使用的 Vulkan 圖形 API。這將極大地有助于其在 Android 設(shè)備上的開發(fā)和采用。
由于新設(shè)計(jì)基于 RISC-V,任何人都可以使用該架構(gòu),而無需支付指令集版稅——與 x86 和 ARM 不同。如果它按預(yù)期工作,這些芯片可能會(huì)震動(dòng)微處理器行業(yè)。理論上,目前使用的標(biāo)準(zhǔn)設(shè)計(jì)并不像 X-Silicon 聲稱的那樣靈活或強(qiáng)大。
盡管我們可能不需要等很長(zhǎng)時(shí)間才能知道,但它在實(shí)踐中是否和紙面上一樣有效還有待觀察。據(jù)報(bào)道,軟件開發(fā)工具包將于今年某個(gè)時(shí)候向早期合作伙伴發(fā)布。
X-Silicon 的低功耗、開放標(biāo)準(zhǔn)、支持 Vulkan 的 C-GPU
X-Silicon Inc. (XSi) 展示了其開放標(biāo)準(zhǔn)、低功耗 C-GPU 架構(gòu),將 GPU 加速與 RISC-V 矢量 CPU 內(nèi)核和緊密耦合內(nèi)存相結(jié)合,形成低功耗、單處理器解決方案。它是其統(tǒng)一 RISC-V 矢量 CPU-with-GPU ISA 的開源版本,并通過硬件抽象層 (HAL) 提供寄存器級(jí)硬件訪問。XSi C-GPU 中的 NanoTile 架構(gòu)旨在處理實(shí)時(shí)數(shù)據(jù)處理和動(dòng)態(tài)圖形渲染,克服了傳統(tǒng) GPU 架構(gòu)的限制。
20 多年來,業(yè)界一直在尋求一種足夠靈活且可擴(kuò)展的開放標(biāo)準(zhǔn) GPU,以支持各種市場(chǎng),例如 AR/VR、汽車、互聯(lián)物聯(lián)網(wǎng)以及包括機(jī)器人在內(nèi)的龐大嵌入式垂直市場(chǎng)。X-Silicon 的動(dòng)態(tài)且高度可擴(kuò)展的 C-GPU NanoTile 架構(gòu)及其同時(shí)或順序處理多個(gè)任務(wù)的能力在這方面是獨(dú)一無二的。
X-Silicon Inc (XSi) 是一家總部位于圣地亞哥的初創(chuàng)公司,成立于 2022 年 3 月,推出了其最新創(chuàng)新:開放標(biāo)準(zhǔn)、低功耗 C-GPU 架構(gòu),將 GPU 加速融入 RISC-V 矢量 CPU 核心,緊密耦合的內(nèi)存,提供低功耗、單處理器解決方案。XSi 的方法引入了其統(tǒng)一 RISC-V 矢量 CPU-with-GPU ISA 的開源,并通過硬件抽象層 (HAL) 提供寄存器級(jí)硬件訪問。該公司表示,這使得原始設(shè)備制造商和內(nèi)容提供商能夠通過不同尋常的定制來定制驅(qū)動(dòng)程序和應(yīng)用程序,這與競(jìng)爭(zhēng)對(duì)手的封閉解決方案不同。XSi 相信,它在 RISC-V 上率先采用融合 GPU 加速的 Vulkan,促進(jìn)了 Android 設(shè)備上的開發(fā),這對(duì)于有效應(yīng)對(duì)多樣化的嵌入式垂直市場(chǎng)至關(guān)重要。
XSi的C-GPU采用NanoTile架構(gòu),該公司表示該架構(gòu)可以滿足實(shí)時(shí)數(shù)據(jù)處理和動(dòng)態(tài)圖形渲染的需求。傳統(tǒng)的 GPU 架構(gòu)難以處理動(dòng)態(tài)數(shù)據(jù),因此需要一種新穎的方法。XSi 表示,其處理器專為動(dòng)態(tài)內(nèi)容的最佳管理和渲染而設(shè)計(jì),超越了傳統(tǒng) GPU 的限制。通過集成 AI/ML 計(jì)算和 GPU 渲染,NanoTile 可確保效率和適應(yīng)性,是實(shí)現(xiàn)高級(jí)圖形算法的理想選擇。
該公司擁有 14 項(xiàng)專利,聲稱其 NanoTile 架構(gòu)徹底改變了 AI/ML 計(jì)算和 GPU 渲染。這些專利專注于優(yōu)化處理核心和內(nèi)存之間的數(shù)據(jù)流、減少延遲并提高計(jì)算效率。此外,NanoTile 的專利 IP 可以在邊緣和云配置中進(jìn)行部署,從而培育 GPU 計(jì)算的聯(lián)合模型并提供靈活性和可擴(kuò)展性。
XSi 的開放標(biāo)準(zhǔn)、低功耗 C-GPU 架構(gòu)和 NanoTile 平臺(tái)預(yù)示著 GPU 技術(shù)的范式轉(zhuǎn)變。憑借對(duì)開放標(biāo)準(zhǔn)、可定制硬件訪問和動(dòng)態(tài)內(nèi)容渲染方法的支持,XSi 認(rèn)為它將為 GPU 架構(gòu)樹立新標(biāo)準(zhǔn),使開發(fā)人員和 OEM 能夠在圖形渲染和 AI/ML 方面釋放前所未有的性能和效率水平。計(jì)算應(yīng)用程序。
該公司報(bào)告稱,RISC-V 生態(tài)系統(tǒng)對(duì)一家新的計(jì)算圖形公司的推出做出了積極反應(yīng),該公司完全致力于推進(jìn)開放標(biāo)準(zhǔn)生態(tài)系統(tǒng)。
該公司計(jì)劃在今年晚些時(shí)候向選定的一組早期開發(fā)合作伙伴提供其軟件開發(fā)套件。
初創(chuàng)公司將 MIMD 引入圖形和計(jì)算領(lǐng)域
X-Silicon 由前硅谷專家組建,旨在通過能夠執(zhí)行 AI、HPC 和 2D/3D 圖形任務(wù)的基于 RISC-V 矢量的統(tǒng)一圖形計(jì)算引擎 (C-GPU) 徹底改變 GPU 設(shè)計(jì)。其 MIMD 架構(gòu)可在單個(gè)內(nèi)核內(nèi)獨(dú)立執(zhí)行 CPU 和 GPU 代碼,從而降低內(nèi)存使用量并提高性能。該公司的多核布局具有快速合成器結(jié)構(gòu),可增強(qiáng)不同應(yīng)用的數(shù)據(jù)聚合。X-Silicon 尋求通過近內(nèi)存計(jì)算和新穎的硬件設(shè)置來減少 GPU 延遲,并獲得 14 項(xiàng)專利的支持。X-Silicon面向AR/VR、嵌入式設(shè)備、汽車等領(lǐng)域,支持標(biāo)準(zhǔn)API和開放式編程,可實(shí)現(xiàn)快速開發(fā)。最初的 IP 銷售針對(duì) OEM 和超大規(guī)模廠商。
我們?cè)趺纯矗恳恍┬录軜?gòu)的市場(chǎng)已經(jīng)成熟。三巨頭已經(jīng)從傳統(tǒng)的 SIMD 中榨取了一切,并添加了額外的核心,例如矩陣數(shù)學(xué)(有時(shí)稱為張量核心)、光線追蹤干擾測(cè)試引擎、編****和音頻處理器。X-Silicon 認(rèn)為它可以通過緊密耦合的塊通信 MIMD 架構(gòu)來滿足許多(如果不是全部)這些專用處理器需求。為此,他們將利用 RISC-V ISA。
在2022年,一群來自 AMD、高通、英特爾、ATI Technologies、戴爾和其他公司的工程師、建筑師、程序員和商業(yè)開發(fā)人員正在努力工作。開發(fā)了一種新的 GPU 設(shè)計(jì),并意識(shí)到他們應(yīng)該為自己的公司命名。作為新手,他們知道初創(chuàng)企業(yè)會(huì)浪費(fèi)大量時(shí)間來嘗試獲得一個(gè)聰明、令人難忘的名稱和徽標(biāo)。所以選擇了X。它可以是實(shí)驗(yàn)性的、性感的或未知的——希望這一切都是真的。
為了徹底改造 GPU 著色器核心,X-Silicon 表示正在創(chuàng)建一種新的可擴(kuò)展的基于 RISC-V 矢量的統(tǒng)一計(jì)算圖形引擎 (C-GPU),該引擎可以高效地計(jì)算傳統(tǒng) GPU 所無法勝任的下一代工作負(fù)載類型。
此類應(yīng)用包括人工智能、高性能計(jì)算、視覺、幾何計(jì)算以及 2D 和 3D 圖形。該公司表示,其 MIMD 架構(gòu)具有獨(dú)特的能力,能夠在同一核心中獨(dú)立運(yùn)行 CPU 和 GPU 代碼,提供低內(nèi)存占用執(zhí)行、硬件寄存器裸機(jī)編程、高性能、低功耗操作和替換等功能使用單個(gè)指令流,將傳統(tǒng)著色器程序與適用于 CPU 和 GPU 的開源 RISC-V ISA 結(jié)合起來。
在該公司的多核設(shè)計(jì)中,多個(gè) C-GPU 核心平鋪在一個(gè)芯片上,并使用片上快速合成器結(jié)構(gòu)進(jìn)行連接,該結(jié)構(gòu)可以將每個(gè)核心的輸出動(dòng)態(tài)聚合到一個(gè)公共緩沖區(qū)中,即用于圖形用例的幀緩沖區(qū)或用于編****、視頻效果處理和 AI 處理的流水線緩沖區(qū),如下圖所示。
在此設(shè)計(jì)中,快速片上 SRAM 或 eDRAM 緩存將用作二級(jí)緩存,可以聚合來自多個(gè)內(nèi)核的數(shù)據(jù)。計(jì)算 RAM (C-RAM) 的常見操作在內(nèi)存附近完成,將進(jìn)一步減少帶寬并進(jìn)一步提高性能。該公司聲稱,每個(gè)核心都可以進(jìn)行軟件編程,以獨(dú)立于所有其他核心來計(jì)算圖形、人工智能、視頻、物理、高性能計(jì)算或其他工作負(fù)載。
因此,工作負(fù)載可以并行或流水線方式實(shí)現(xiàn),并在核心上同時(shí)運(yùn)行,而不是在傳統(tǒng) GPU 上順序運(yùn)行。X-Silicon 表示,它還可以在核心上運(yùn)行操作系統(tǒng)。
該公司聲稱,它還可以通過近內(nèi)存計(jì)算、統(tǒng)一內(nèi)存架構(gòu)和其他新穎的硬件配置來加速計(jì)算,從而減少 GPU 固有的延遲。他們?yōu)榇松暾?qǐng)了 14 項(xiàng)專利。
前迪士尼/Applied Minds/Giant AI 動(dòng)畫行業(yè)專家 Eric Powers 評(píng)論道:“幾十年來,高端動(dòng)畫和效果一直無法切換到 GPU 來生成最終圖像。專業(yè)渲染管道軟件的巨大復(fù)雜性和規(guī)模,加上專用 GPU 設(shè)計(jì)導(dǎo)致跨越內(nèi)存和平臺(tái)障礙的巨大成本,完全阻礙了我們最先進(jìn)技術(shù)中 GPU 的大規(guī)模采用。集成設(shè)計(jì)使 HPC 開發(fā)人員能夠就地訪問直接硬件加速(例如 X-Silicon 的 C-GPU 架構(gòu)),這是帶領(lǐng)我們跨越這一邊界的唯一未來。”
X-Silicon 的 C-GPU 為希望控制其計(jì)算和 GPU 命運(yùn)的 OEM 提供了新興用例的市場(chǎng)機(jī)會(huì)。它允許新的 API(包括自定義 API)以及為應(yīng)用程序定制的生態(tài)系統(tǒng),而不是引導(dǎo) API 來執(zhí)行它從未打算執(zhí)行的任務(wù)。它不再要求原始設(shè)備制造商和制造商屈服于停滯不前的生態(tài)系統(tǒng)中的五巨頭。該公司認(rèn)為其市場(chǎng)機(jī)會(huì)在于新興市場(chǎng),例如具有更長(zhǎng)電池壽命的娛樂和企業(yè)AR/VR、具有顯示需求的智能嵌入式設(shè)備、需要可預(yù)測(cè)專用處理的低成本汽車顯示器和模塊、可穿戴設(shè)備、定制動(dòng)畫處理和別的。
該公司計(jì)劃支持直接硬件和像素訪問,因此對(duì)于低內(nèi)存應(yīng)用程序,不需要龐大的驅(qū)動(dòng)程序。該公司表示,X-Silicon 的開放標(biāo)準(zhǔn)方法及其自己的開放編程模型將有助于快速、輕松地開發(fā)新用例以及改進(jìn)現(xiàn)有產(chǎn)品。當(dāng)然,X-Silicon還計(jì)劃支持傳統(tǒng)軟件生態(tài)系統(tǒng)中的所有API,包括OpenGL ES、Vulkan、Mesa和OpenCL,但該公司還將提供硬件抽象層(HAL),允許直接訪問其他人則優(yōu)化開源或創(chuàng)建自己的驅(qū)動(dòng)程序和自定義 API。這是特別有趣的,因?yàn)樵摷軜?gòu)支持新興技術(shù),包括傳統(tǒng)架構(gòu)不支持的新渲染模型,例如神經(jīng)輻射場(chǎng)(NeRF)和非三角形圖元。
該公司計(jì)劃首先向 OEM、超大規(guī)模廠商和其他系統(tǒng)集成商出售 IP。首次硅片的推出日期尚未給出。
X-Silicon 將 CPU 和 GPU (C-GPU) 與單一 ISA 和開放圖形操作系統(tǒng) (GOS) 平臺(tái)集成,可以對(duì)下一代圖形渲染的整體軟件開發(fā)、支持和維護(hù)產(chǎn)生深遠(yuǎn)影響。這可以在未來的圖形領(lǐng)域開啟一個(gè)激動(dòng)人心的創(chuàng)新時(shí)代,為新興和傳統(tǒng)細(xì)分市場(chǎng)提供新的圖形算法、性能、功耗、靈活性和成本的方法。這種方法徹底改變了圖形世界,讓 OEM 擺脫了傳統(tǒng) GPU 供應(yīng)商的束縛,這些供應(yīng)商提供具有復(fù)雜 API 和昂貴的傳統(tǒng)支持的黑匣子驅(qū)動(dòng)程序。
傳統(tǒng) GPU SIMD 架構(gòu)受制于主機(jī) CPU、操作系統(tǒng)和圖形服務(wù),限制了創(chuàng)新并有助于保持現(xiàn)有企業(yè)對(duì)其市場(chǎng)的控制。新的、新興的、較小的垂直市場(chǎng),通常得不到這些傳統(tǒng)圖形供應(yīng)商的服務(wù),可以開發(fā)和支持引人注目的圖形解決方案,這些解決方案可以在產(chǎn)品的生命周期內(nèi)升級(jí)和維護(hù)。使用新顯示技術(shù)、新格式和使用范例(VR/AR、360、深度、立體、多平面全息)的下一代產(chǎn)品通常需要一種新的渲染方法。新的開發(fā)和部署范例還需要一致的架構(gòu),例如可從邊緣擴(kuò)展到云的架構(gòu)。
X-Silicon 不僅僅是傳統(tǒng) GPU 供應(yīng)商的開源替代方案,它還準(zhǔn)備提供一種新技術(shù)圖形處理框架,該框架融入了最新的人工智能和超越基于三角形的渲染,以提供自 3D 引入以來從未見過的創(chuàng)新平臺(tái)本世紀(jì)初移動(dòng)設(shè)備上的圖形。
來源:半導(dǎo)體行業(yè)觀察
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。