國產(chǎn)CPU里程碑!龍芯最強處理器、自研GPGPU來了,披露Tock“三劍客”
編輯 | Panken芯東西11月28日報道,今日,國產(chǎn)CPU企業(yè)龍芯中科自主研發(fā)的新一代CPU 3A6000發(fā)布,這也是我國國產(chǎn)CPU領域的最新里程碑成果。龍芯3A6000采用龍芯自主指令系統(tǒng)龍架構(LoongArch),是龍芯第四代64位高性能微架構LA664的首款產(chǎn)品,且主要IP核均自主研發(fā),采用成熟工藝生產(chǎn),主頻達到2.5GHz,支持多線程技術,全芯片共8個邏輯內(nèi)核。該CPU采用全自研高性能DDR4接口,訪存效率超過80%,動態(tài)頻率電壓調節(jié)能效提升,相比于上一代龍芯3A5000,相同頻率下整數(shù)通用性能提升60%以上,多核性能翻番。龍芯中科技術股份有限公司董事長胡偉武稱,3A6000的性能已經(jīng)達到十代酷睿四核處理器水平。他談道,龍芯中科要構建獨立于x86和Arm的第三套新型信息技術體系和產(chǎn)業(yè)生態(tài)。
在第三季度業(yè)績說明會上,胡偉武還提到:“我們正在努力提高每GHz性能接近或達到蘋果CPU的水平?!彼€透露,“3B6000將爭取每GHz的性能再提高20%-30%,在此基礎上用先進工藝提高主頻?!?/p>
▲龍芯中科技術股份有限公司董事長胡偉武
同時,龍芯中科推出了打印機主控芯片龍芯2P0500,這是國內(nèi)首款基于自主指令系統(tǒng)的打印機主控芯片。
01.將自主化優(yōu)勢轉化成技術優(yōu)勢性能追上十代酷睿四核處理器
當下全球的信息產(chǎn)業(yè)構建在西方主導的x86體系之上。胡偉武談道,2021年我國硅上工業(yè)企業(yè)利潤率為6.8%,其中電子工業(yè)利潤率為5.9%。2021年我國電子工業(yè)的利潤總額為8283億元,蘋果一個公司就達到946億美元。
胡偉武談道,CPU和操作系統(tǒng)是信息產(chǎn)業(yè)的底座,但還有更底層的根技術被卡脖子,比如指令系統(tǒng)、芯片生產(chǎn)工藝和設備材料等。國內(nèi)很多CPU都是基于Arm,操作系統(tǒng)都是基于安卓等,胡偉武認為,我們要將自主經(jīng)營到底,把底層的根技術做起來,不依賴國外授權和供應鏈,只依賴人力資源和礦產(chǎn)資源。因此,龍芯中科要構建獨立于x86和Arm的第三套新型信息技術體系和產(chǎn)業(yè)生態(tài),其自研的指令集架構龍架構就是第三套體系的基礎。
龍芯中科有三大系列CPU產(chǎn)品,龍芯3號CPU系列是面向桌面、服務器應用,龍芯2號SOC系列,面向工控和終端應用,龍芯1號面向的是嵌入式專門應用。
胡偉武稱,龍芯的主要IP核均自主研發(fā),目前龍芯的軟硬IP核數(shù)量已經(jīng)有上百種。下圖中,龍芯3A6000結構圖中4個方塊就是4個核,標紅的就是3A6000用到的IP。其中,PCIe的IP為自主研發(fā),可以做得很小并且成本更低,這也是自己做IP的好處。
3A6000有4個物理核和8個邏輯核,主頻2.0GHz到2.5GHz,還有片內(nèi)集成安全可信模塊,支持安全啟動和國密算法。
首先,3A6000采用龍芯第四代64位高性能微架構LA664,這一架構有兩個特點,首先是大幅提升性能,其次是實現(xiàn)了同時多線程技術。胡偉武透露,龍芯的芯片是一個套殼加Tock+Tick,基于第二代GS464E,3A3000性能提升1.6倍。
龍芯3號系列芯片按照Tick-Tock路線發(fā)展,Tick指的是工藝節(jié)點的增強,Tock指的是微體系結構的增強。
第三代架構是GS464V、LA464,與3A3000相比,3A4000工藝沒變,通過結構優(yōu)化性能提高了兩倍,3A5000采用更先進工藝性能提升了1.5倍。
3A6000采用的是第四代架構,使得CPU在相同工藝下性能比上一代產(chǎn)品大幅提高。根據(jù)電子四院的報告,3A6000單線程通用處理性能提升60%,多進程通用處理性能提升100%。
定點單線程的性能分數(shù)是43分,CPU 2017的單線程性能是5分。
CPU執(zhí)行指令的過程中,由于指令供給不及時等,存在空閑指令。同時多線程就使得CPU核心“一心二用”,也就是在單位時間內(nèi)執(zhí)行多個線程的更多指令,3A6000性能在相同工藝下相比上一代產(chǎn)品大幅提高。3A6000的性能達到十代酷睿四核處理器水平,2.5GHz的龍芯3A6000和3.6GHz的酷睿i3比較數(shù)據(jù)如下:
胡偉武稱,龍芯中科走出了一條基于成熟工藝,通過設計優(yōu)化提高性能的道路,標志著在弱一點的工藝條件下,與英特爾、AMD等的產(chǎn)品性能可比。下一步龍芯中科將繼續(xù)基于成熟制程研發(fā),達到英特爾先進工藝的性能。
2013年,胡偉武就在反思,中國CPU和國外先進水平的主要性能差距在什么地方?是通用處理能力不行、還是專業(yè)處理能力不行?是單核性能不足還是核數(shù)不夠?是設計能力不行還是工藝不行?
他認為,剛剛提到的43分,就相當于3A6000“研究生畢業(yè)”。并且當時龍芯3A1000主頻差距在2-3倍,每GHz性能差距為4-6倍。
目前,龍芯中科已經(jīng)完成了通用處理性能技術補課,十代酷睿是2020年的產(chǎn)品,胡偉武稱,現(xiàn)在很多人電腦上還用的是八代、九代酷睿,今年龍芯中科推出的3A6000已經(jīng)達到市場主流水準。
龍芯中科已經(jīng)完成龍芯3C6000設計,龍芯3C6000采用單硅片16核32線程,通用處理性能成倍提升,內(nèi)存采用DDR4-3200x4,訪存帶寬比上一代3C5000成倍提高。
此外,3C6000通過龍鏈技術實現(xiàn)了片間互聯(lián),實現(xiàn)LS3D6000雙硅片32核64線程、LS3E6000四硅片64核128線程,支持GPGPU、各類加速器擴展。胡偉武認為,龍架構指令系統(tǒng)是龍芯的一個貢獻,片間互聯(lián)就是龍芯的第二個貢獻,未來,龍芯中科都會開放。
龍芯中科突破片間高速互聯(lián)技術,對標的是nVLink、CXL,這也是破解Chiplet技術的關鍵。片間互聯(lián)可以大幅降低延遲提高帶寬效率。
在GPGPU方面,龍芯第二代自研圖形處理器LG200有圖形加速、科學計算加速、AI加速三個功能,右邊是GPGPU的結構圖。
龍芯中科將基于2K3000的GPGPU技術及3C6000的龍鏈技術,研制專用GPGPU芯片。胡偉武認為,由本次發(fā)布的桌面處理器龍芯3A6000、在研服務器處理器龍芯3C6000和移動桌面終端處理器2K3000構成的龍芯“三劍客”已具有一定開放市場競爭力。02.自主化優(yōu)勢轉化為軟件生態(tài)優(yōu)勢三大階段完成生態(tài)建設
指令系統(tǒng)是軟件生態(tài)的基礎,2020年,龍芯中科推出龍芯指令系統(tǒng)結構LoongArch,簡稱龍架構或LA架構,完成了自主知識產(chǎn)權評估。
胡偉武透露,構建龍架構軟件生態(tài)分三個階段。
首先是夯實基礎,龍芯中科的架構已經(jīng)得到國際開源軟件認可,開發(fā)者可以完全基于龍架構的國際開源軟件直接構建出完整的操作系統(tǒng)。其次,該框架得到了國內(nèi)操作系統(tǒng)和基礎應用的認可和支持,目前支持統(tǒng)信、麒麟、歐拉、龍蜥、開源鴻蒙等操作系統(tǒng),支持WPS、微信、QQ、釘釘、騰訊會議、美團等應用。
第二要克服Linux生態(tài)碎片化的特點,實現(xiàn)不同分支及版本的應用兼容。龍芯平臺支持不同版本不同分支,如麒麟的應用在統(tǒng)信上可以跑,統(tǒng)信的應用在麒麟生態(tài)上也可以跑。
龍芯中科已經(jīng)升級完成,目前正在做廣泛兼容,在龍架構上運行x86、Windows應用,但不能運行Windows,還有運行安卓應用。
第三是自主應用。胡偉武稱,龍芯中科要推出自主編程框架,就像安卓、iOS等一樣有自己的應用平臺。
在廣泛兼容方面,通過二進制方案運行x86應用,龍芯中科要架起兩座橋,一個是把x86的指令翻譯成龍架構指令,一個是把Windows接口翻譯成Linux接口。
龍架構的一大優(yōu)勢就是可以自由加指令,將不侵權的功能類似的指令加進去,翻譯時就相當于英文翻中文。
打印機驅動是Linux的一大難題,多數(shù)打印機只有Windows驅動,沒有Linux驅動?,F(xiàn)在龍芯架構可以支持95%以上的打印機。
通過二進制翻譯運行x86應用,龍芯生態(tài)可以運行絕大多數(shù)x86和Linux應用,用戶體驗流暢,對于x86/Windows應用可以大量運行。龍芯下一代處理器將完善對二進制翻譯的支持,如x87的80位浮點指令。
03.構建獨立于x86和Arm之外的生態(tài)體系
3A6000性能達到市場主流產(chǎn)品水平,龍芯架構的基礎軟件生態(tài)基本建成,龍芯中科要構建獨立于x86和Arm體系的自主信息技術體系。
為了加強生態(tài)體系建設,龍芯中科要與合作伙伴共建。首先解決做龍架構芯片企業(yè)少的問題,龍芯中科將CPU IP核開放授權,且不收版稅。未來,龍架構指令系統(tǒng)也會開放授權。
胡偉武演講前面提到一個問題,龍芯CPU最自主所以性能低生態(tài)差?他的答案是,龍芯CPU最自主,所以性能最高。原因在于自主研發(fā)的CPU沒有天花板,產(chǎn)品可以在市場實踐中不斷迭代,3A6000就是個例子。他補充說,龍芯CPU軟件生態(tài)最好,理由是自主生態(tài)只能靠自己建,靠跟著走沒有前途。因此,龍芯中科要將自主化的優(yōu)勢轉化為性能和生態(tài)優(yōu)勢,與x86和Arm體系三足鼎立,形成新型信息技術體系和軟件生態(tài)。04.結語:自研CPU任重道遠
以通用CPU、GPU為代表的計算芯片是算力的基石,是計算系統(tǒng)和信息基礎設施的核心,當下核心技術受制于人是我國產(chǎn)業(yè)發(fā)展最大的隱患。近年來,以龍芯中科為代表的企業(yè)推動核心技術突破,使得國產(chǎn)芯片性能持續(xù)提升,供應鏈的可持續(xù)性、生態(tài)完備性上也取得進步。
此次,龍芯中科正式發(fā)布龍架構,并開放了IP授權,同時,國產(chǎn)操作系統(tǒng)、應用軟件的協(xié)同發(fā)展,將加速國產(chǎn)CPU生態(tài)建設。面對新一輪科技革命和產(chǎn)業(yè)革命加速演進,以龍芯中心為代表的國產(chǎn)玩家正在通過自主研發(fā)、創(chuàng)新突破一步步探索芯片研發(fā)的天花板,推動國產(chǎn)CPU性能和成熟度不斷提升。 科普視頻
未來,AI將惠及每一個人,這一切如何實現(xiàn)?聯(lián)想集團發(fā)布的系列主題視頻,將從AI終端到行業(yè)專屬定制AI,乃至更智能的社會,展開一副人工智能全圖景。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。