中科院歷時5年打造RISC-V設(shè)計平臺,開源芯片死結(jié)有望打開!
說這話的人是中國科學(xué)院計算技術(shù)研究所研究員、先進(jìn)計算機(jī)系統(tǒng)研究中心主任包云崗,幾年前他所在的中國科學(xué)院大學(xué)有 35% 的學(xué)生不喜歡做芯片,現(xiàn)在不少學(xué)生已經(jīng)開始熱衷于做芯片,并已經(jīng)有學(xué)生“帶芯畢業(yè)”。
2020 年 6 月,五位 95 后本科生,帶著自己設(shè)計的處理器芯片“果殼(NutShell)” ,從中國科學(xué)院大學(xué)畢業(yè),這在國內(nèi)非常罕見。
整個芯片從設(shè)計到研發(fā),耗時僅僅 4 個月,如此高效率的研發(fā),得益于包云崗團(tuán)隊研發(fā)的開源芯片設(shè)計平臺——SERVE。
在 2020 中關(guān)村論壇未來青年論壇現(xiàn)場,DeepTech 專訪包云崗,并請他重點闡述了 SERVE 開源芯片設(shè)計平臺的現(xiàn)狀。SERVE 的誕生,要從 2012 年開始,這是一個摸索著長大的產(chǎn)品。2016 年,負(fù)責(zé)團(tuán)隊耗時 4 年,終于研發(fā)出 SERVE 第一版。
同時,包云崗和團(tuán)隊核心成員張科博士、常軼松博士也在繼續(xù)探索。在明確開源方向后,他們決定把 SERVE,打造成開源芯片設(shè)計平臺。2019 年,SERVE 發(fā)布第三版,并發(fā)揮作用至今。
SERVE 的主要作用,是在芯片設(shè)計結(jié)束以后,對芯片進(jìn)行開發(fā)驗證。由于 SERVE 的研究人員,本身也是高校老師,他們“就地取材”,圍繞教學(xué)場景針對教學(xué)中遇到的需求,尋找技術(shù)實現(xiàn)手段。 此前,芯片驗證一般得用 FPGA 仿真硬件基礎(chǔ)設(shè)施,并且芯片上面還得運行軟件,因此要想測試芯片是否有問題,就得讓它跑起來。跑的過程中遇到問題,就要反饋給設(shè)計人員進(jìn)行修復(fù)。
包云崗在教學(xué)實踐中發(fā)現(xiàn),上述做法面臨的痛點是,不是每個學(xué)生拿到的開發(fā)板都很穩(wěn)定,這樣就會導(dǎo)致很多無解類問題。
而 SERVE 的作用,正是用于尋找無解類問題。它能通過聯(lián)網(wǎng)來給芯片做驗證,芯片的開發(fā)流程也會因此加快。
之所以具備該功能,是因為 SERVE 使用了一種新架構(gòu)——SoC-FPGA,相比亞馬遜 F1 FPGA 云平臺,SERVE 的密度更高,一個平臺上可以集成 32 個 FPGA,并且每個 FPGA 上面還有強(qiáng)大的計算力。這樣既有較高的密度,又有較強(qiáng)的計算能力,整個芯片系統(tǒng)可以獲得更好的性價比。
包云崗介紹稱,SERVE 在遠(yuǎn)程教學(xué)中,也發(fā)揮了重要作用。2020 上半年,學(xué)生都在家學(xué)習(xí),而 SERVE 讓學(xué)生們即便不在學(xué)校,也照樣可以完成硬件實驗。
截止目前,在疫情期間,128 位該校學(xué)生登錄 SERVE 近兩萬次,并借此進(jìn)行了近兩千小時的實驗。
過去幾年,中國科學(xué)院大學(xué)一直讓本科生用 SERVE 去做教學(xué)實驗,學(xué)生對計算機(jī)組成原理教學(xué)實驗平臺的滿意度,也從 27% 增長到 88%。
把芯片設(shè)計搬到云上來
SERVE 的目標(biāo),是要把芯片設(shè)計過程搬到云上去。未來,該平臺有望實現(xiàn)所有的芯片設(shè)計,都能在云上完成。 屆時,開發(fā)人員只需一個帳號,就能在云平臺里面,制作芯片開發(fā)的基礎(chǔ)組件,并能完成開發(fā)和驗證等所有過程,從而產(chǎn)出芯片設(shè)計版圖。版圖設(shè)計出來后,就可以交給芯片制造廠商去制造。
據(jù)包云崗介紹,在云上做芯片設(shè)計,也是未來的趨勢,如果再融入開源要素,還能幫助降低芯片設(shè)計和驗證的成本。 而降低設(shè)計成本,正是降低芯片制造門檻的首要因素。當(dāng)前芯片的生產(chǎn)要素如 EDA、IP、仿真驗證平臺等造價都非常昂貴,如果生產(chǎn)要素特別難獲取,生產(chǎn)門檻就會非常高。 他舉例稱,以 14 納米芯片為例,一般需要幾千萬甚至上億元的研發(fā)經(jīng)費。這樣的投入,只有少數(shù)企業(yè)才能承擔(dān)。如果是創(chuàng)業(yè)公司,還沒開始創(chuàng)業(yè)就要花這么多錢購買設(shè)備,那么芯片行業(yè)自然難以注入新鮮力量。 說到這里,包云崗說開發(fā) App 的要素都是開源的,三五位工程師下載一些開源組件,很快就能做出一款 App。同樣,通過開源和云上設(shè)計的方式,也能讓芯片設(shè)計像開發(fā) App 一樣簡單。
“讓天下沒有難做的芯片”
2019 年 10 月份,《經(jīng)濟(jì)學(xué)人》雜志有篇文章提到:過去十年開源軟件讓智能手機(jī)實現(xiàn)了大爆發(fā),未來十年新的開源硬件有可能讓物聯(lián)網(wǎng)設(shè)備實現(xiàn)類似的爆發(fā)。 包云崗介紹稱,開源芯片已經(jīng)是大家比較關(guān)注的新趨勢。
它背后有三大驅(qū)動力,第一是當(dāng)前技術(shù)發(fā)展的整體趨勢,如 2020 年中國半導(dǎo)體行業(yè)明顯“變熱”;
第二是人才,和美國相比,近十年在芯片設(shè)計領(lǐng)域里面,中國仍有 20 倍人才差距;
第三是產(chǎn)業(yè),如果把領(lǐng)域?qū)<业闹R實現(xiàn)到芯片里面,就能把芯片性能功耗比提升幾百倍。
談及芯片和開源的結(jié)合,包云崗表示,一枚芯片的誕生,包括設(shè)計、制造和封裝等三個階段,這和出版小說的過程很相似。 設(shè)計階段,就好比把小說寫出來;制造階段,相當(dāng)于寫完后把電子稿發(fā)給印刷廠、并把它印出來;封裝測試好比把它封裝成一本書。 他舉例稱,以寒武紀(jì)公司為例,他們把人工智能、深度神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的設(shè)計固化到硬件里面,最終做出的 AI 芯片,比通用芯片的各方面性能都高出一個數(shù)量級。 由于寒武紀(jì)芯片針對的是某一類大領(lǐng)域,公司需要投入上千研發(fā)人力。但還有很多場景,不需要面對復(fù)雜應(yīng)用,也不需要投入過多人力,可能只是做窗簾里面一個小處理器,這個小處理器只需感知光線是強(qiáng)還是弱,并根據(jù)光的強(qiáng)弱、接收手機(jī)發(fā)來的請求,從而實現(xiàn)窗簾的自動開關(guān)。 而用多快好省的方式快速做出芯片,便是降低芯片門檻的主要意義所在。對于有較強(qiáng)應(yīng)用需求的小芯片來說,它們將在未來實現(xiàn)門檻低、成本低、周期迭代的能力。這樣,便能最大程度激發(fā)芯片領(lǐng)域的創(chuàng)新活躍度。 包云崗繼續(xù)分析稱,現(xiàn)在全中國有 400 多萬個 App,App 擁有量位居世界首位,每個 App 都需要團(tuán)隊開發(fā),未來這些 App 可直接跟芯片關(guān)聯(lián)起來。仍以窗簾為例,假如開發(fā)一個 App 控制窗簾,那么與窗簾對應(yīng)的芯片,也可以打包形成一個軟硬結(jié)合的解決方案。 比如,一家窗簾公司不僅可以給用戶提供智能窗簾,還能給用戶一個 App,用戶在手機(jī)上可以很容易地控制窗簾。與此同時,窗簾公司還能很快做出一款小芯片,并嵌入到的窗簾里面。 這樣,窗簾跟 App 是緊耦合的關(guān)系,它們之間可以通信,App 里面的請求可以發(fā)送到芯片里面,進(jìn)而通過芯片來控制窗簾。這類芯片的出貨量會比較大,相應(yīng)的場景需求也比較多。包云崗表示,希望未來能把門檻降低到連窗簾公司都可以自己做芯片。 相比中低端芯片,高端芯片的制造門檻更難以降低。以建筑為例,假如要造大興機(jī)場,就不是以成本為中心來考慮,因為它是非常高端的明星項目,需要先進(jìn)的工程設(shè)備來做。 而大量存在的普通居民樓和寫字樓,會更加重視經(jīng)濟(jì)適用。而包云崗團(tuán)隊目前正在解決的問題,是怎么把量大面廣的芯片生產(chǎn)門檻降下來。 他認(rèn)為,假如造一個普通房子,都需要尖端人員來做,那么房子的推廣成本就會非常高。
而把制造量大面廣的芯片,跟計算機(jī)體系結(jié)構(gòu)(Computer Architecture)對應(yīng)起來,事情就會更加容易。
在計算機(jī)體系結(jié)構(gòu)領(lǐng)域中做開源,相當(dāng)于把很多預(yù)制件都做好、并加以儲備,以備隨時使用。比如,僅用 10 天就可以造出雷神山和火神山醫(yī)院,此前長沙還曾用 7 天造出 10 幾層樓的酒店。 為什么能做到這一點?因為已經(jīng)標(biāo)準(zhǔn)化,有了預(yù)制件就能很快構(gòu)建出建筑。包云崗認(rèn)為,當(dāng) AIoT(人工智能物聯(lián)網(wǎng))得到進(jìn)一步普及后,芯片也應(yīng)朝此方向發(fā)展,因為它跟建筑一樣,也有量大面廣的需求。屆時,芯片制造就會更快更便宜,造出來的芯片也會更適用。
開源芯片死結(jié)有望打開
但就開源芯片的研發(fā),還面臨著“死結(jié)”。由于投入很大,大家不愿意開源,沒有可用的開源資源,就只能花高價去買 IP。
與此同時,大家又都希望一次流片成功,所以會花更多的時間去驗證它,導(dǎo)致人力成本高企。如今,這個死結(jié)有望打破。
開源芯片設(shè)計平臺 SERVE,相當(dāng)于一群人合伙做出預(yù)制件,根據(jù)這些預(yù)制件就能快速搭出產(chǎn)品。從宏觀角度來看,開源就像基建一樣需要有投入,投入以后不見得能看到回報,因為做完以后就要貢獻(xiàn)給大家使用。 從商業(yè)模式角度來看,開源芯片設(shè)計平臺,就像是國家建設(shè)高速公路,前期投入很大,但是建好以后大家的出行會很方便。 正所謂要想富先修路,高速公路一旦建成,就可以促進(jìn)很多產(chǎn)業(yè)的發(fā)展,這便是基礎(chǔ)設(shè)施的作用。開源芯片設(shè)計平臺也是同樣的道理,芯片門檻降低以后,平臺就可以變成公共設(shè)施,廠商就可以在平臺上做自己的芯片。
包云崗指出,構(gòu)建開源芯片生態(tài),需要四大元素:開源開放的指令集、開源的 EDA 工具鏈、敏捷開發(fā)語言、操作系統(tǒng)和編譯器。 以開源開放的指令集這一元素為例,得益于開放和免費,RSIC-V(一個基于精簡指令集原則的開源指令集架構(gòu))已經(jīng)逐漸為人所知。
打個比方,指令集相當(dāng)于一種語言的語法和詞匯,而每一種語言都有一本字典,去解釋這種語言的語法和詞匯的便是指令集手冊。 指令集手冊都比較厚,以 X86 指令集手冊為例,頁數(shù)多達(dá) 5000 多頁,而 RISC-V 指令集手冊只有 200 多頁,本科生就可以讀懂。頁數(shù)少且淺顯易懂,這樣就可以用較少的人才投入,用它去做處理器芯片設(shè)計。
不同指令集的規(guī)模差別也很大,X86 如今已有 3000 多條指令,但事實上并不需要這么多。而 RISC-V 基礎(chǔ)指令只有 47 條,且可以完成很多功能。
與此同時,RISC-V 是模塊化的,雖然只有 47 條基礎(chǔ)指令,但其可以像搭積木一樣,根據(jù)需求構(gòu)建出定制的處理器。 仍以高速公路為例,路面可以行駛各種各樣的車輛,車主也可以基于不同的目的來使用高速公路,有的是做物流,有的是出去旅游。
對于開源芯片設(shè)計平臺來說,廠商也可以在上面發(fā)揮各種想象力和創(chuàng)造力,從 0 到 1 開拓出新業(yè)務(wù)。 可以說,開源芯片是一個生態(tài)基礎(chǔ),而包云崗的工作則是構(gòu)建一個類似于公共服務(wù)的生態(tài),讓芯片設(shè)計可以有更多創(chuàng)新。
芯片門檻降低以后,“良禽”才會“擇木而棲”。相比如日中天的互聯(lián)網(wǎng)行業(yè),芯片行業(yè)研發(fā)人員收入普遍不高,但是芯片人才的要求卻很高,他們既需要懂設(shè)計流程,又需要懂前端、后端等一系列技術(shù)。 包云崗認(rèn)為,中國還沒有像英特爾和英偉達(dá)這樣的 GPU 純設(shè)計公司,中國的 GPU 跟美國的差距也在十年以上。
其中一個原因正是因為芯片門檻過高,人才很難保持活躍度,資本也不太愿意進(jìn)去。只有降低芯片門檻,學(xué)生才會不再害怕做芯片,人才參與一旦增多,資本也更愿意加入。
不過他同時指出,門檻也不能降得過低,移到中間某一個位置時,就會形成較好的業(yè)界態(tài)勢,這時便可以創(chuàng)造更大價值。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。