中國(guó)服務(wù)器芯片迎來(lái)高光時(shí)刻
最近,中國(guó)本土服務(wù)器芯片出現(xiàn)兩大亮點(diǎn):首先,RISC-V 又進(jìn)一步,特別是以山東大學(xué)部署的采用 RISC-V CPU 的服務(wù)器為代表,十分引人關(guān)注;其次,基于自研架構(gòu)的高性能芯片繼續(xù)取得本土客戶的認(rèn)可,凸出代表就是華為和龍芯自研的 CPU,特別是華為的服務(wù)器芯片,市場(chǎng)接受度進(jìn)一步提升。
本文引用地址:http://m.butianyuan.cn/article/202311/452945.htm中國(guó) RISC-V 芯片和系統(tǒng)進(jìn)展
RISC-V 指令集架構(gòu)是免費(fèi)、開源的,提供了一種更快、更便宜的芯片設(shè)計(jì)方案,而且,RISC-V 的結(jié)構(gòu)使其非常適用于處理各種應(yīng)用和復(fù)雜計(jì)算需求的云原生環(huán)境。近些年,RISC-V 對(duì)英特爾和 AMD 使用的 x86 架構(gòu),以及亞馬遜、蘋果、三星和高通等公司使用的 Arm 架構(gòu)的威脅越來(lái)越大,雖然短期內(nèi)還無(wú)法實(shí)現(xiàn)替代,但長(zhǎng)期發(fā)展前景非常好。也正是因?yàn)槿绱耍瑖?guó)內(nèi)外多家廠商和科研機(jī)構(gòu)都在 RISC-V 技術(shù)和產(chǎn)品研發(fā)方面加大投入。
在中國(guó)大陸市場(chǎng),還存在減少對(duì)西方芯片技術(shù)依賴的問題,在此情況下,RISC-V 的優(yōu)勢(shì)就更凸出了。
10 月,山東大學(xué)部署了一個(gè)采用 RISC-V CPU 的服務(wù)器集群,該系統(tǒng)共有 3072 個(gè)核,有 48 個(gè) 64 位 RISC-V CPU 節(jié)點(diǎn)。阿里巴巴生態(tài)系統(tǒng)總監(jiān)陳大偉在加利福尼亞州圣克拉拉舉行的 RISC-V 峰會(huì)上發(fā)表演講時(shí)表示,這是 RISC-V 集群在云端的首次部署,目前,該系統(tǒng)主要用于山東大學(xué)的教學(xué)和科研項(xiàng)目,部分功能也可用于商用云計(jì)算。
據(jù)悉,山東大學(xué)的 RISC-V 系統(tǒng)采用了國(guó)內(nèi)某公司的 SG2042 芯片,該芯片主頻為 2GHz,緩存為 64MB。系統(tǒng)支持 PCIe Gen 4 接口。今年早些時(shí)候,該公司發(fā)布了 RISC-V 芯片,阿里巴巴與其合作將 Linux 操作系統(tǒng)引入該服務(wù)器集群。不過(guò),目前的 RISC-V 軟件生態(tài)系統(tǒng)還比較弱,需要時(shí)間去培育。
目前,中國(guó)已經(jīng)實(shí)現(xiàn)流片的 RISC-V 芯片主要采用 110nm 和 28nm 制程工藝,但相關(guān)產(chǎn)品和系統(tǒng)僅用于科學(xué)研究,未完全達(dá)到商用水平。
今年,中國(guó)科技部資助了多個(gè) RISC-V 芯片的研發(fā)工作,許多大學(xué)和科研院所都開始專注于 RISC-V 芯片開發(fā)。
中國(guó)科學(xué)院 (CAS) 正在與阿里巴巴、騰訊和中興通訊等中國(guó)本土頂尖企業(yè)合作開發(fā)名為「香山-v3」的 RISC-V 芯片,同時(shí),相關(guān)的新型操作系統(tǒng)也在開發(fā)過(guò)程中。CAS 希望該芯片的性能能與 Arm 于 2021 年發(fā)布的 Neoverse-N2 服務(wù)器 CPU 相當(dāng)。據(jù)悉,中國(guó)相關(guān)企業(yè)和科研機(jī)構(gòu)正在開發(fā)專門用于 RISC-V 芯片設(shè)計(jì)的開源 EDA 工具。
經(jīng)過(guò)這些年的推廣和積累,中國(guó)相關(guān)企業(yè)和科研機(jī)構(gòu)已經(jīng)成為全球 RISC-V 芯片和解決方案的主要貢獻(xiàn)者。2022 年,全球生產(chǎn)了 100 億顆 RISC-V 芯片,其中,一半在中國(guó)制造。
國(guó)際廠商在 RISC-V 方面的進(jìn)展
十年前,當(dāng) RISC-V 問世后,迅速獲得了包括蘋果公司在內(nèi)的國(guó)際芯片大廠的支持,最近幾年,英特爾也很看好 RISC-V 的發(fā)展前景,并加大了投入。
如前文所述,RISC-V 的軟件生態(tài)系統(tǒng)比較弱,針對(duì)于此,英特爾的 Codeplay 軟件部門發(fā)布了 OneAPI 套件,其中包括供開發(fā)人員在 x86 PC 上的模擬 RISC-V 環(huán)境中測(cè)試代碼的工具。該套件的標(biāo)志性功能是支持 SYCL,它允許編碼人員在不同的硬件架構(gòu)上編譯應(yīng)用程序。該套件包括對(duì)英特爾 DPC++/C++編譯器的支持,允許重新編譯 C++代碼,可以跨多個(gè)硬件架構(gòu)使用。
如果沒有硬件和軟件協(xié)同設(shè)計(jì)的架構(gòu),編碼人員就會(huì)習(xí)慣性地使用 x86 和 Arm 系統(tǒng)。對(duì)此,英特爾的做法是:在芯片發(fā)布之前就提供 Linux 驅(qū)動(dòng)程序,以確保硬件與最新版本的操作系統(tǒng)兼容。
開發(fā)人員還可以在類似 Raspberry Pi 的開發(fā)板或 Milk-V、StarFive 等公司的系統(tǒng)上測(cè)試 RISC-V 代碼,這兩家公司都提供支持 Linux 的 64 位 RISC-V 系統(tǒng)。
目前來(lái)看,一些 RISC-V 軟件包(如 Pytorch、GCC、TensorFlow 和 OpenJDK)可以正常工作,但尚未完全得到支持,近些年,對(duì) LibreOffice 和 Firefox 等開源應(yīng)用程序的支持正在建立過(guò)程中。廠商方面,谷歌正在加速對(duì) RISC-V 上的 AOSP(Android 開源項(xiàng)目)的支持,這將是下一個(gè)架構(gòu)規(guī)范的重要組成部分。
RISC-V 服務(wù)器芯片制造商 Esperanto Technologies 和 Ventana Micro Systems 已經(jīng)推出了用于云計(jì)算的芯片,其中,Esperanto 已將 Meta 的 Open Pre-Trained Transformer 模型移植到其 RISC-V 服務(wù)器上。不過(guò),總體來(lái)看,這兩家公司涉及軟件支持和編程模型的產(chǎn)品和服務(wù)并不多。
負(fù)責(zé)開發(fā)和推進(jìn) RISC-V 標(biāo)準(zhǔn)的 RISC-V International 正在研發(fā)架構(gòu)規(guī)范,試圖通過(guò)建立 RISC-V 軟件生態(tài)系統(tǒng)(稱為 RISE),為 RISC-V 系統(tǒng)創(chuàng)建底層軟件工具和中間件,該項(xiàng)目的支持者包括谷歌、英特爾、英偉達(dá)、高通、三星和 Ventana 等公司。
在歐洲,英特爾正在與巴塞羅那超級(jí)計(jì)算中心(BSC)合作,為超級(jí)計(jì)算機(jī)制造 RISC-V 芯片。BSC 希望高性能 RISC-V 處理器能盡早商用,他們希望利用 Chiplet(小芯片)技術(shù),將 RISC-V 內(nèi)核整合到 Chiplet 架構(gòu)中,這正是英特爾的強(qiáng)項(xiàng),未來(lái),英特爾將會(huì)制造越來(lái)越多的 Chiplet 架構(gòu)芯片,以增加設(shè)計(jì)靈活性,因?yàn)樗軐?CPU、GPU、I/O、內(nèi)存、電源管理和其它電路功能放入同一個(gè)封裝中。如果能將 RISC-V 與內(nèi)存通過(guò) Chiplet 架構(gòu)封裝在一起,則可以降低眼下的內(nèi)存帶寬瓶頸,從而拓寬 RISC-V 在機(jī)器學(xué)習(xí)應(yīng)用領(lǐng)域的發(fā)展道路。
最近,Meta 也推出了一款基于 RISC-V 架構(gòu)的 AI 推理芯片。
由于中國(guó)已經(jīng)是全球 RISC-V 產(chǎn)業(yè)的重要組成部分,因此,國(guó)際產(chǎn)業(yè)界一直在呼吁加強(qiáng)與中國(guó)的合作。RISC-V International 首席執(zhí)行官 Calista Redmond 表示:「健康的合作和競(jìng)爭(zhēng)可以推動(dòng)最先進(jìn)技術(shù)向前發(fā)展。我想強(qiáng)調(diào)一點(diǎn),正確的全球標(biāo)準(zhǔn)支撐著我們?cè)跉v史進(jìn)程中所見過(guò)的最重要的技術(shù),無(wú)論是 USB 還是以太網(wǎng),以及 HTTPS 等網(wǎng)絡(luò)協(xié)議。這些東西可以創(chuàng)造公平的競(jìng)爭(zhēng)環(huán)境,讓我們能夠創(chuàng)新。」
業(yè)界普遍反對(duì)政府對(duì) RISC-V 開發(fā)與合作的限制和干擾,美國(guó)業(yè)界人士表示:「任何限制都只會(huì)減少美國(guó)對(duì)一項(xiàng)重要新興技術(shù)的參與,同時(shí)鞏固 Arm 作為現(xiàn)有嵌入式 CPU 壟斷供應(yīng)商的地位?!?/p>
RISC-V 距離規(guī)模商用依然較遠(yuǎn)
目前來(lái)看,RISC-V 處理器在高性能計(jì)算領(lǐng)域的應(yīng)用和研究依然處于探索階段。軟件生態(tài)系統(tǒng)、芯片、電路板和系統(tǒng)的可靠性問題并沒有解決。除了技術(shù),商業(yè)問題也很凸出。
目前,RISC-V 處理器僅能滿足嵌入式應(yīng)用場(chǎng)景,對(duì)于高性能服務(wù)器來(lái)說(shuō),還無(wú)法承擔(dān)那樣的性能負(fù)荷,不要說(shuō)服務(wù)器,就目前而言,RISC-V 還不能滿足 PC 的應(yīng)用要求。
就目前的發(fā)展階段和性能來(lái)看,RISC-V 并不適合做高性能 CPU。RISC-V 標(biāo)準(zhǔn)指令集非常精簡(jiǎn),32 位基礎(chǔ)指令是 47 條,64 位基礎(chǔ)指令是 15 條,基礎(chǔ)指令共 62 條,加上并入標(biāo)準(zhǔn)的擴(kuò)展指令,總數(shù)在 300 條左右,而 Arm 的指令數(shù)超過(guò) 2000 條,x86 則更多。由于 RISC-V 的功能比較簡(jiǎn)單,用 RISC-V 和龍芯實(shí)現(xiàn)同樣的功能(GCC 編譯器),RISC-V 會(huì)比龍芯多用 20% 的指令。
雖然 RISC-V 允許拓展指令集,但這并不能解決一切問題,因?yàn)檐浖鷳B(tài)系統(tǒng)支持不足的話,單靠拓展指令集是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)樯碳易约和卣沟牟皇?RISC-V 標(biāo)準(zhǔn)指令集,很容易產(chǎn)生碎片化問題,缺乏統(tǒng)一性的話,軟件生態(tài)系統(tǒng)建設(shè)就會(huì)缺乏錨點(diǎn),很難讓一套軟件生態(tài)滿足所有拓展出的 RISC-V 指令要求。
中國(guó)本土 CPU 新勢(shì)力崛起
除了 RISC-V 處理器,近期,中國(guó)本土其它架構(gòu)高性能計(jì)算產(chǎn)品也在不斷突破應(yīng)用極限,華為、龍芯等都有好消息傳出。
2022 年底,英偉達(dá)的高性能 GPU 芯片 H100(全球人工智能應(yīng)用系統(tǒng)的首選處理器)被禁止銷往中國(guó)大陸,那之后,中國(guó)本土企業(yè)只能購(gòu)買降低了內(nèi)存帶寬的版本,也就是 H800 和 A800,但是,近期,這些降速版本的 GPU 也被禁售了。
在這樣的背景下,華為自研的昇騰 910 和昇騰 310 處理器,特別是性能更高的昇騰 910,及其最新版本芯片得到了越來(lái)越多中國(guó)本土 IT 系統(tǒng)設(shè)備和互聯(lián)網(wǎng)大廠的青睞,訂單量持續(xù)提升。這兩款芯片是華為在 2018 年發(fā)布的,同期還推出了神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu)、開發(fā)工具包和跨 AI 的云訓(xùn)練框架。
今年 8 月,中國(guó)人工智能公司科大訊飛董事長(zhǎng)劉慶峰高度評(píng)價(jià)了華為開發(fā)的處理器,將它比作英偉達(dá)的 A100。劉慶峰表示,科大訊飛正在與華為合作進(jìn)行硬件開發(fā)。當(dāng)然,不止科大訊飛一家,有幾家中國(guó)本土頭部 IT 和互聯(lián)網(wǎng)大廠都在與華為合作,開發(fā)高性能計(jì)算系統(tǒng)。
英偉達(dá)在 2020 年和 2022 年分別推出了 A100 和 H100 芯片,憑借多年的技術(shù)積累,以及先發(fā)優(yōu)勢(shì),英偉達(dá)占據(jù)了全球 AI 芯片市場(chǎng)的最大份額,而生成式 AI 的興起進(jìn)一步鞏固了該公司的行業(yè)地位。在生態(tài)系統(tǒng)方面,華為要想與英偉達(dá)競(jìng)爭(zhēng),最大的劣勢(shì)是人工智能軟件生態(tài),這方面,英偉達(dá)已經(jīng)非常完善了,需要后來(lái)者付出幾倍的努力才有趕超希望。
近些年,華為也在建設(shè)自己的人工智能生態(tài)系統(tǒng),被稱為 CANN。不過(guò),據(jù)專家介紹,與英偉達(dá)的生態(tài)系統(tǒng)相比,華為在訓(xùn)練 AI 模型方面存在局限性,需要補(bǔ)的課還很多。
除了華為,龍芯是另一大看點(diǎn)。
近期,龍芯確認(rèn),將在 11 月底正式推出處理器 3A6000,測(cè)試數(shù)據(jù)顯示,3A6000 的 SPEC 性能達(dá)到了英特爾 10 代酷睿 4 核處理器的水準(zhǔn)。
雖然龍芯一直受到質(zhì)疑,但是,其每一代處理器的性能提升確是肉眼可見的。這次,3A6000 依然基于該公司自研的 LoongArch 指令集架構(gòu),工藝制程依舊是 12nm,內(nèi)核升級(jí)為 LA664,也就是 64 位。3A6000 為 4 核處理器,所以擁有 4 個(gè) LA664 核心,支持 128 位向量處理擴(kuò)展指令(LSX)和 256 位高級(jí)向量處理擴(kuò)展指令(LASX)。
另外,3A6000 的一個(gè)非常大的變化是首次支持同步多線程技術(shù),也就是超線程技術(shù),所以,3A6000 實(shí)際為 4C8T。頻率依舊是 2.5GHz,L3 為 16MB,支持 DDR4-3200 內(nèi)存。
龍芯還推出了服務(wù)器 CPU 芯片 3C6000 和 3D6000,以及具有較高性價(jià)比的桌面級(jí) CPU 芯片 2K3000,可用于上網(wǎng)本、工控、迷你主機(jī)等。
龍芯也在 GPU 方面發(fā)力,近期推出了 9A1000,對(duì)標(biāo) AMD 的 RX 550 顯卡,計(jì)劃在 2024 年第三季度流片。9A1000 支持科學(xué)計(jì)算加速和 AI 加速。
結(jié)語(yǔ)
目前,PC 和手機(jī)應(yīng)用發(fā)展已經(jīng)達(dá)到瓶頸期,未來(lái)幾年,主要拼存量市場(chǎng),對(duì)增量市場(chǎng)已經(jīng)沒有什么期待了。因此,在處于成長(zhǎng)階段的中國(guó)大陸半導(dǎo)體市場(chǎng),特別是各個(gè)系統(tǒng)必需的 CPU、GPU 等處理器,必需要以有巨大增量市場(chǎng)為主要目標(biāo),而高性能計(jì)算和 AI 的發(fā)展前景非常廣闊。
在這樣的大背景下,中國(guó)本土相關(guān)企業(yè)和科研院所正在加大對(duì)擁有較大發(fā)展?jié)摿Φ募夹g(shù)領(lǐng)域的投入,這其中就包括 RISC-V,同時(shí),也不能放下自主處理器架構(gòu)的開發(fā),只有兩條腿走路,一條充分與國(guó)際接軌,另一條立足于自主,才能在未來(lái)的競(jìng)爭(zhēng)中擁有更多籌碼。
中國(guó)本土企業(yè)之間,以及與相關(guān)的科研院所,也需要進(jìn)一步加強(qiáng)溝通與合作,這樣可以提升芯片和系統(tǒng)研發(fā)效率。
評(píng)論