常見(jiàn)國(guó)產(chǎn)處理器指令集體系及來(lái)源
國(guó)產(chǎn)處理器“取代”Intel、AMD等國(guó)際公司的處理器一直是國(guó)家的戰(zhàn)略和夢(mèng)想,如今在太湖之光計(jì)算機(jī)上算是真正圓夢(mèng)了,不過(guò)當(dāng)初的新聞報(bào)道中筆者也看到了評(píng)論中很多人對(duì)國(guó)產(chǎn)處理器的批評(píng),這個(gè)問(wèn)題也是影響國(guó)產(chǎn)處理器發(fā)展的一個(gè)重要因素,因?yàn)樯鷳B(tài)體系的缺乏,中國(guó)發(fā)展自己的處理器也只能是“摸著石頭過(guò)河”,這個(gè)石頭就是國(guó)外已經(jīng)發(fā)展的處理器指令集,但這種路線又很容易被不明真相的圍觀者嘲諷——都用了別人的指令集了,怎么還敢叫自主產(chǎn)權(quán)?
本文引用地址:http://m.butianyuan.cn/article/201710/365816.htm多年前龍芯處理器的架構(gòu)師胡偉武博士也解釋過(guò):“我們CPU也是可以做世界第一的,而且有,關(guān)鍵就是沒(méi)法用,用戶不用你。”軟件生態(tài)的現(xiàn)實(shí)決定了國(guó)產(chǎn)處理器不可能從0開(kāi)始研發(fā),在這方面日本80-90年代通過(guò)TRON計(jì)劃研制通用OS、CPU但最終失敗的例子可以說(shuō)是前車之鑒,反而C919大飛機(jī)這種國(guó)際化分工合作的模式容易獲得成功。
今天我們就來(lái)簡(jiǎn)單了解下國(guó)內(nèi)處理器的指令集體系及技術(shù)來(lái)源。根據(jù)公開(kāi)來(lái)源,筆者能找到的有代表性的國(guó)產(chǎn)處理器方案主要有龍芯、申威、兆芯、飛騰、宏芯以及智能手機(jī)/平板領(lǐng)域發(fā)展最好的海思、展訊、全志等,他們所用的架構(gòu)涉及X86、ARM、MIPS、Power及SPARC、Alpha等,如下圖所示:
龍芯:血統(tǒng)純正的中國(guó)芯,商業(yè)化不盡如人意
龍芯并非最早的國(guó)產(chǎn)處理器,也不是最成功的國(guó)產(chǎn)處理器,但提到國(guó)產(chǎn)處理器,大家第一個(gè)想到的恐怕就是龍芯了,它是曝光率最高的國(guó)產(chǎn)處理器,而且考慮到它是中科院計(jì)算機(jī)所研發(fā)的,其血統(tǒng)的純正性更容易成為國(guó)產(chǎn)處理器的代表。
龍芯課題組于2001年成立,不過(guò)龍芯處理器的正式誕生之日是2002年8月10日,在計(jì)算所長(zhǎng)李國(guó)杰院士的領(lǐng)導(dǎo)下,龍芯之父胡偉武博士及其團(tuán)隊(duì)拿出了龍芯1號(hào)處理器,當(dāng)年他還寫過(guò)《我們的龍芯1號(hào)》一文介紹龍芯的研發(fā)歷程,小編當(dāng)年也看過(guò)這篇文章,記憶猶新的是龍芯的中文代號(hào)是“狗剩”,源于中國(guó)人“賴名好養(yǎng)活”的習(xí)俗,不過(guò)也可以看出團(tuán)隊(duì)對(duì)龍芯處理器的未來(lái)雖然有期待,但當(dāng)時(shí)應(yīng)該是挺擔(dān)心這個(gè)項(xiàng)目的未來(lái)發(fā)展的,只是龍芯的英文名就非常高大上了——Godson,上帝之子!
龍芯一出世就頂著自主研發(fā)的美名,但是沒(méi)多久就被爆出龍芯的指令集實(shí)際上是源于MIPS,也就是說(shuō)是買來(lái)的,這讓龍芯瞬間被千夫所指,研發(fā)團(tuán)隊(duì)也背負(fù)了罵名和壓力,胡偉武博士也解釋過(guò)為何選擇MIPS指令集,前面說(shuō)的“用戶不用你”就是根本原因,自建一套軟件生態(tài)系統(tǒng)對(duì)中科院這樣的學(xué)術(shù)單位來(lái)說(shuō)是不可能的任務(wù)。
對(duì)龍芯的第二個(gè)質(zhì)疑在于他們選擇了MIPS指令集而非現(xiàn)在大紅大紫的ARM指令集,不過(guò)時(shí)間回溯到2000年代(龍芯立項(xiàng)研發(fā)的時(shí)代可能更早一些),當(dāng)時(shí)的ARM可沒(méi)有如今這般強(qiáng)勢(shì),而MIPS在大學(xué)、科研單位有良好的基礎(chǔ),龍芯團(tuán)隊(duì)選擇MIPS也是情有可原。
不管怎樣,龍芯這個(gè)項(xiàng)目算是活下來(lái)了,從最初的龍芯1到目前的龍芯3已經(jīng)發(fā)展了三代了,每一代其實(shí)又衍生出了多個(gè)版本,從單核、雙核到四核、八核,從180nm工藝到28nm工藝,從雙發(fā)射到四發(fā)射,龍芯處理器的架構(gòu)、規(guī)格、頻率、性能都在不斷進(jìn)步,龍芯3B2000甚至號(hào)稱性能達(dá)到了Intel Ivy Bridge處理器的水平,其指令集其實(shí)已經(jīng)遠(yuǎn)遠(yuǎn)超出了MIPS范疇,加入了很多龍芯團(tuán)隊(duì)自己開(kāi)發(fā)的指令,比之前的產(chǎn)品增加了500多條自定義龍芯擴(kuò)展指令,可用于實(shí)現(xiàn)對(duì)其他主流指令系統(tǒng)的二進(jìn)制翻譯兼容,另外存儲(chǔ)訪問(wèn)和I/O效率也有大幅的提高,還有一點(diǎn)就是軟硬件將保持向前兼容。
但是龍芯也不是沒(méi)有槽點(diǎn),大多數(shù)龍芯處理器其實(shí)活在了中科院給外界展示成果的展臺(tái)上,盡管多年來(lái)大家對(duì)龍芯抱以期待,中科院甚至讓旗下的江蘇夢(mèng)蘭集團(tuán)參與成立中科龍夢(mèng)公司加速商業(yè)化,也推出了靈瓏/福瓏/逸瓏臺(tái)式機(jī)、筆記本等產(chǎn)品,但這些產(chǎn)品大都曇花一現(xiàn),性能無(wú)法達(dá)到主流水平,很快就被人給忘記了。
申威/飛騰:最成功的國(guó)產(chǎn)處理器,軍方的秘密武器
申威和飛騰盡管選擇的處理器路線不同,不過(guò)這兩家要放在一起說(shuō)了,因?yàn)檫@兩家背后有軍方背景,申威處理器是無(wú)錫江南計(jì)算技術(shù)研究所研發(fā)的,后者也是總參謀部第五十六研究所,它有個(gè)名字是上海高性能集成電路設(shè)計(jì)中心,而天津飛騰是國(guó)防科大旗下的。此外,早前我們還報(bào)道過(guò)一家名為PhyTIum公司在去年的Hotchips 2015會(huì)議上推出了代號(hào)為Mars(火星)的多核處理器,這家公司是廣州飛騰,據(jù)說(shuō)也是國(guó)防科大下屬的,但跟研發(fā)飛騰FT處理器的天津飛騰又不是一家單位。
回到正題,江南所在計(jì)算機(jī)技術(shù)研究上也是老資歷了,不過(guò)在處理器指令集上他們的選擇看起來(lái)有點(diǎn)非主流——DEC公司的Alpha 21264指令集,在技術(shù)上Alpha有獨(dú)特之處,DEC當(dāng)年在處理器市場(chǎng)也曾叱咤風(fēng)云,AMD的K7架構(gòu)就有部分技術(shù)源于Alpha架構(gòu),AMD上上上任CEO德克·梅爾(Dirk Meyer)就來(lái)自DEC公司,去年辭職走人的Zen架構(gòu)之父Jim Keller也曾在DEC公司研發(fā)Alpha架構(gòu)。
如今DEC公司早就煙消云散,公司幾經(jīng)轉(zhuǎn)賣,微軟在Win2000之后也放棄了對(duì)Alpha架構(gòu)的支持,Alpha架構(gòu)也早就不再更新了,專利也過(guò)期了,這可能是江南所選擇Alpha架構(gòu)的原因之一。2011年濟(jì)南的超算中心部署了神威藍(lán)光,它所用的處理器就是神威SW1600,16核心,現(xiàn)在的資料都認(rèn)為它是基于專利已經(jīng)過(guò)期的DEC ALPHA 21164A EV-56架構(gòu)。
申威SW26010處理器是260核心
這次的太湖之光的神威SW26010處理器也是江南所研發(fā)的,雖然大家猜測(cè)它還是Alpha指令集,但跟龍芯后續(xù)架構(gòu)類似,申威SW26010的架構(gòu)、指令集已經(jīng)遠(yuǎn)遠(yuǎn)超出了之前的范疇,加入了很多新指令。這次的SW26010就是260核心眾核架構(gòu),亂序執(zhí)行架構(gòu),頻率1.45GHz,整個(gè)處理器包括4個(gè)MPE(Management Processing Element)管理單元、4個(gè)CPE(CompuTIng Processing Element)計(jì)算單元及4個(gè)MC內(nèi)存控制器單元組成,其中CPE單元又由8x8陣列的64核心組成,所以總計(jì)是260個(gè)核心(4x64+4=260)。
與其他國(guó)產(chǎn)處理器相比,申威系在性能上完全走在了前列,在世界范圍內(nèi)都是靠前的,SW26010的理論浮點(diǎn)性能高達(dá)3TFLOPS,其性能完全可與Inel最新的Xeon Phi加速卡一拼。不過(guò)申威處理器的不足之處在于內(nèi)存系統(tǒng),太湖之光性能達(dá)到天河2號(hào)三倍的同時(shí)總內(nèi)存反而從1.4PB降低到了1.31PB,每個(gè)節(jié)點(diǎn)使用了四路128bit DDR3-2133內(nèi)存,帶寬為136GB/s,這一點(diǎn)上不如Intel的Xeon Phi加速卡,后者自身集成了16GB eDRAM緩存,帶寬超過(guò)500GB/s,而且早就支持DDR4內(nèi)存了。
再來(lái)說(shuō)下飛騰,天津飛騰研發(fā)的FT系列處理器也在HPC領(lǐng)域有過(guò)應(yīng)用,不過(guò)飛騰FT處理器用的架構(gòu)更雜亂,從公開(kāi)資料來(lái)看第一代FT處理器兼容于Intel安騰2指令集,第二代FT-64處理器在銀河計(jì)算機(jī)中有過(guò)使用,第三代產(chǎn)品FT-1000則是基于開(kāi)源的UltraSPARC架構(gòu),8核64線程,在天河1號(hào)計(jì)算機(jī)的節(jié)點(diǎn)網(wǎng)絡(luò)上有使用。
之后的FT-1500還是基于SPARC架構(gòu),制程工藝從65nm升級(jí)到了40nm,16核心128線程,在天河2號(hào)超算中使用了4096顆FT-1500處理器作為節(jié)點(diǎn)前端處理器。
最新的FT-1500A雖然名字跟上面的類似,但實(shí)際上沒(méi)什么關(guān)系了,因?yàn)樗募軜?gòu)變成了ARM 64位,使用的是28nm工藝。據(jù)天津飛騰總經(jīng)理谷虹介紹,F(xiàn)T-1500A系列處理器是64位通用CPU,兼容ARM V8指令集,采用國(guó)際先進(jìn)的28nm工藝流片,具有高性能、低功耗等特點(diǎn),關(guān)鍵技術(shù)國(guó)內(nèi)領(lǐng)先,可實(shí)現(xiàn)對(duì)Intel中高端“至強(qiáng)”服務(wù)器芯片的替代,并廣泛應(yīng)用于政府辦公和金融、稅務(wù)等各行業(yè)信息化系統(tǒng)之中。
不論是申威還是飛騰,這兩家軍方背景的國(guó)產(chǎn)處理器單位因?yàn)槟繕?biāo)明確,可以說(shuō)是國(guó)產(chǎn)處理器中做的最成功的——不論性能還是架構(gòu)設(shè)計(jì)都有獨(dú)特之處,申威處理器不僅有硬件研發(fā),還在編譯器及Linux操作系統(tǒng)(神威睿思)上做了創(chuàng)新,太湖之光這次有三項(xiàng)應(yīng)用入圍戈登貝爾獎(jiǎng),這也得歸功于江南所在超算應(yīng)用上的努力。
中晟宏芯:借力藍(lán)色巨人IBM,Power架構(gòu)能撐起一片天?
通用處理器架構(gòu)也曾百花齊放,Intel當(dāng)年面對(duì)的對(duì)手比現(xiàn)在多得多,但X86現(xiàn)在差不多一統(tǒng)天下了,能跟Intel競(jìng)爭(zhēng)的公司就更少了,強(qiáng)大如IBM這樣擁有Power架構(gòu)的公司也不行了,他們索性于2013年聯(lián)合NVIDIA、泰安電腦等公司成立OpenPower開(kāi)放聯(lián)盟,其他公司也可以獲得Power架構(gòu)授權(quán)。此后在2014年還推動(dòng)成立中國(guó)POWER技術(shù)產(chǎn)業(yè)生態(tài)聯(lián)盟,IBM與多家中國(guó)公司簽署了授權(quán)協(xié)議,中晟宏芯就是其中的一家。
IBM的Power架構(gòu)一度成為國(guó)產(chǎn)處理器的希望
中晟宏芯成立于2013年,發(fā)起人是江蘇夢(mèng)蘭集團(tuán)、江蘇中晟智源、蘇州高新創(chuàng)業(yè)投資集團(tuán),夢(mèng)蘭集團(tuán)之前我們說(shuō)過(guò)是中科院旗下的公司,而后兩者可以說(shuō)是江蘇政府代表,因此中晟宏芯獲得Power架構(gòu)技術(shù)得到了工信部及江蘇政府、中科院計(jì)算所的支持,計(jì)算所甚至派了一個(gè)技術(shù)團(tuán)隊(duì),如果一切都能按照預(yù)定的引進(jìn)、消化、吸收,中晟宏芯應(yīng)該在2019年推出國(guó)產(chǎn)化的Power處理器。
但是事與愿違,中晟宏芯雖然很快就推出了CP1處理器,但這只是IBM Power 8處理器的馬甲而已,還沒(méi)等這家公司消化Power技術(shù),他們就鬧出了欠薪風(fēng)波,中科院派出的技術(shù)人員發(fā)不出工資,此后公司也不斷動(dòng)蕩,股東發(fā)生變化,人員也波動(dòng)頻繁,指望中晟宏芯推動(dòng)Power架構(gòu)國(guó)產(chǎn)化是沒(méi)希望了。
此外,IBM的Power架構(gòu)在國(guó)內(nèi)銀行等關(guān)鍵行業(yè)有重要應(yīng)用,而且Power處理器性能強(qiáng)勁,是個(gè)好東西,但真要引進(jìn)消化也沒(méi)這么容易,以Power 8架構(gòu)為例,它是12核心96線程,核心面積達(dá)到了650mm2,復(fù)雜度遠(yuǎn)高于普通處理器,再加上原本使用的是IBM自己的22nm SOI工藝,而SOI工藝已經(jīng)沒(méi)多少代工廠搞了(GlobalFoundries用過(guò),28nm節(jié)點(diǎn)放棄,后來(lái)又繼承了IBM的衣缽),這無(wú)疑增加了Power處理器的國(guó)產(chǎn)化難度。
·兆芯/海光:中國(guó)能用X86技術(shù)打敗Intel、AMD?
前面提到的國(guó)產(chǎn)處理器中,除了軍方背景的申威、飛騰之外,基于MIPS、SPARC以及Power架構(gòu)的處理器發(fā)展過(guò)程都是一波三折,他們面臨的核心問(wèn)題也是一樣的——軟件生態(tài)遠(yuǎn)不如X86。既然大家都能注意到這個(gè)問(wèn)題,那中國(guó)為什么不直接選擇X86體系呢?這是個(gè)好問(wèn)題,你還別說(shuō),國(guó)內(nèi)還真有搞X86架構(gòu)的。
國(guó)內(nèi)較早跟X86架構(gòu)授權(quán)有關(guān)的是北大微電子中心,2005年AMD跟中國(guó)政府達(dá)成了協(xié)議,科技部指定北大微電子中心接收AMD Geode-2處理器技術(shù)授權(quán),北大微電子中心還把這事作為重點(diǎn)宣傳,表示“這是美國(guó)歷史上,第一次向在美國(guó)境外授權(quán)開(kāi)發(fā)X86兼容的微處理器及系統(tǒng)芯片。此次合作也是迄今為止中美半導(dǎo)體領(lǐng)域最具影響力的技術(shù)合作。”
AMD給的這個(gè)處理器是X86架構(gòu)的,中國(guó)因此獲得了X86技術(shù),不過(guò)Geode處理器大部分人是沒(méi)聽(tīng)說(shuō)過(guò)的吧,因?yàn)檫@是AMD嵌入式處理器,其最初起源于Cyrix公司的MeidaGX平臺(tái),后來(lái)Cyrix這部分業(yè)務(wù)被國(guó)家半導(dǎo)體(NS)收購(gòu),2003年AMD又把國(guó)家半導(dǎo)體的Geode業(yè)務(wù)收了。
AMD授權(quán)給北大的X86技術(shù)顯然不可能是最頂級(jí)的,所以選了嵌入式架構(gòu)給中國(guó),不過(guò)這點(diǎn)“施舍”已經(jīng)可以讓北大好好裝一下了,很多人恐怕不記得還有北大眾志處理器吧,原先也是做MIPS架構(gòu),得到AMD授權(quán)之后,他們的PKUnity86-3就是X86兼容處理器,但最后也是不了了之,也只活在了展臺(tái)上,現(xiàn)在都沒(méi)什么消息了。
說(shuō)得有點(diǎn)遠(yuǎn)了,回到正題上來(lái)。由于X86架構(gòu)是AMD、Intel吃飯的家伙,他們通常是沒(méi)可能把技術(shù)授權(quán)給別人的,AMD之前那個(gè)例子更多地是拿買來(lái)的技術(shù)迎合中國(guó)市場(chǎng)而已,中國(guó)公司從這兩家獲得X86技術(shù)的可能性幾乎沒(méi)了。不過(guò)我們別忘了X86技術(shù)實(shí)際上并非只有AMD和Intel,VIA威盛公司也有X86授權(quán)的,他們的技術(shù)來(lái)源于Cyrix,后者又是Intel當(dāng)年對(duì)外授權(quán)X86技術(shù)的幾家公司之一。
在當(dāng)年的Intel反壟斷案和解之后,VIA的X86技術(shù)也算是正當(dāng)化了,但是VIA自己是個(gè)小公司,沒(méi)法玩轉(zhuǎn)高性能X86架構(gòu)的,他們出的Nano、Nehemiah(尼希米)、Esther(以斯帖)、Isaiah(以賽亞,VIA總經(jīng)理陳文琦、王雪紅夫婦是基督徒,產(chǎn)品代號(hào)也很有宗教特色)等處理器雖然不乏特色,但因?yàn)橹圃旃に嚥荒芨鶬ntel相比,架構(gòu)和性能也是不能相提并論的。既然沒(méi)有市場(chǎng)了,那VIA索性把X86技術(shù)賣給了大陸的上海兆芯公司。
兆芯這家公司也是很有背景的,2013年由上海國(guó)資委旗下的聯(lián)和投資與VIA成立的,注冊(cè)資本2億美元,上海出資80%,VIA占股20%。這次的合作顯然是大陸出錢,VIA出技術(shù),因?yàn)檎仔镜臉I(yè)務(wù)范圍包括X86 CPU、ARM CPU、GPU及芯片組研發(fā)都是VIA現(xiàn)有的,上海國(guó)資委下面的投資公司可沒(méi)這技術(shù)。
憑借雄厚的背景,兆芯如愿拿下了國(guó)家的核高基項(xiàng)目,根據(jù)公開(kāi)報(bào)道兆芯拿到的核高基補(bǔ)貼高達(dá)56億,后續(xù)還在申請(qǐng),總額高達(dá)70億。至于回報(bào),兆芯號(hào)稱自主研發(fā)的ZX-C處理器于2015年4月量產(chǎn),28nm工藝,四核處理器,主頻可達(dá)2.0GHz,TDP功耗僅為18W,并且支持國(guó)密算法加密,但兆芯的CPU基本上都是VIA處理器的馬甲,畢竟從成立到拿出產(chǎn)品只有2年左右的時(shí)間,這么快就生產(chǎn)出四核X86處理器并不容易。
除了上海兆芯,國(guó)內(nèi)另一家獲得X86技術(shù)授權(quán)的是天津海光,這事還得從AMD說(shuō)起,今年Q2季度財(cái)報(bào)公布之后,AMD宣布他們跟中國(guó)天津海光投資公司達(dá)成了協(xié)議,將X86技術(shù)授權(quán)給海光公司,獲得2.93億美元的授權(quán)費(fèi),雙方還會(huì)成立合資公司。
目前有關(guān)AMD、海光的X86授權(quán)協(xié)議還不明確,但AMD這次授權(quán)給中國(guó)公司的X86很可能不再是低端的,因?yàn)锳MD要打開(kāi)中國(guó)高性能服務(wù)器市場(chǎng),授權(quán)的架構(gòu)很可能是高性能的Zen技術(shù),換句話說(shuō)AMD有可能給了中國(guó)公司最尖端的X86技術(shù),如果真是如此,AMD這一次可真的是拼了。
海思:商用市場(chǎng)的成功才是真成功
這里雖然選擇了華為的海思,不過(guò)筆者要說(shuō)的其實(shí)是海思、展訊、全志、瑞芯微等一幫民營(yíng)公司開(kāi)發(fā)的處理器,選擇海思作為代表,是因?yàn)楹K际瞧渲械馁?。這些公司雖然沒(méi)多少背景(海思背后的華為算是大公司,是個(gè)例外),但他們恰恰是商業(yè)化最成功的國(guó)產(chǎn)處理器,這點(diǎn)跟前面介紹的其他處理器不同。
商業(yè)公司以市場(chǎng)為導(dǎo)向,不必背負(fù)什么國(guó)產(chǎn)、自主產(chǎn)權(quán)的壓力,他們無(wú)一例外選擇了最熱門的ARM體系,架構(gòu)也多是購(gòu)買的ARM公司的Cortex-A系列授權(quán),GPU也是花錢授權(quán)的,海思還可以研發(fā)自己的基帶及ISP、DSP等芯片,目前的麒麟950處理器是首款Cortex-A72核心、Mali-T880 GPU及TSMC 16nm Plus工藝處理器,已經(jīng)具備國(guó)際先進(jìn)水平。
總結(jié):
以上介紹的國(guó)產(chǎn)處理器中,他們大體可以寫分為學(xué)院派、軍方派、國(guó)資派及民營(yíng)派,其中商業(yè)化最好的顯然是民營(yíng)派,國(guó)內(nèi)廠商在手機(jī)/平板SoC處理器上已經(jīng)闖出一片天,軍方派的飛騰、申威因?yàn)槟繕?biāo)明確,實(shí)際上發(fā)展的也相當(dāng)成功,申威SW26010在眾核架構(gòu)上也具備世界水準(zhǔn)了。不能讓人滿意的要屬學(xué)院派及國(guó)資派了,龍芯被寄予厚望,但市場(chǎng)化舉步維艱,考慮到MIPS指令集的應(yīng)用場(chǎng)合,龍芯進(jìn)入主流市場(chǎng)是沒(méi)可能了。
評(píng)論