新聞中心

EEPW首頁 > EDA/PCB > 高端訪談 > Imagination推出B系列GPU IP,力挺本土芯片的圖形渲染和AI創(chuàng)新

Imagination推出B系列GPU IP,力挺本土芯片的圖形渲染和AI創(chuàng)新

—— Imagination新聞發(fā)布會訪談
作者:王瑩 時間:2020-10-28 來源:電子產(chǎn)品世界 收藏

2020年10月,半導(dǎo)體知識產(chǎn)權(quán)(IP)供應(yīng)商Imagination Technologies在京舉辦了IMG B系列圖形處理器(GPU)新技術(shù)暨IP新產(chǎn)品發(fā)布會。B系列革命性地采用了多核技術(shù),它們支持更高性能,同時芯片面積比前代產(chǎn)品更小。借助其原生的可擴(kuò)展性,B系列是諸多應(yīng)用市場的終極解決方案,包括Imagination傳統(tǒng)的市場——移動設(shè)備、汽車、數(shù)字電視等,以及新的桌面PC、數(shù)據(jù)中心等。

本文引用地址:http://m.butianyuan.cn/article/202010/419732.htm

多核是否會成為GPU的未來趨勢?B系列IP對標(biāo)市面上現(xiàn)有的哪些GPU芯片?為何B系列會專門推出一個型號面向汽車領(lǐng)域?本土企業(yè)用IP有何挑戰(zhàn)?為此,電子產(chǎn)品世界等媒體采訪了Imagination的相關(guān)領(lǐng)導(dǎo)。線上是英國總部的首席營銷官David Harold,技術(shù)產(chǎn)品高級總監(jiān)Kristof Beets, 線下是副總裁兼中國區(qū)總經(jīng)理劉國軍,中國區(qū)戰(zhàn)略市場與生態(tài)高級總監(jiān)時昕等。

image.png

圖 Imagination首席營銷官David Harold、技術(shù)產(chǎn)品高級總監(jiān)Kristof Beets,副總裁兼中國區(qū)總經(jīng)理劉國軍,中國區(qū)戰(zhàn)略市場與生態(tài)高級總監(jiān)時昕

1 GPU多核是否是趨勢

此次發(fā)布的B系列的一個亮點是增加了多核技術(shù),那么,多核技術(shù)架構(gòu)是不是會成為未來主流的一種技術(shù)趨勢?原有的單核的產(chǎn)品是否會逐漸被多核替代?

我們應(yīng)該在單核和多核之間達(dá)到一種平衡。單核模塊對細(xì)節(jié)的優(yōu)化是非常高效的。但是如果把單核做得過大,對布局、設(shè)計和擴(kuò)展就比較難做的。多核能帶來更好的擴(kuò)展效果、設(shè)計和布局。這就是為什么在多核方面有很多的模塊,以應(yīng)對不同的市場。BXT有4款產(chǎn)品,應(yīng)對到不同的專業(yè)市場。

另一方面,市面上GPU的工作負(fù)載也有很大的改變,越來越多樣化,有圖形渲染的需求,有計算的需求,有更大更小的需求,這就帶來了GPU的布局和架構(gòu)變化的需求。多核架構(gòu)能更好地實現(xiàn)最優(yōu)化,以滿足不同GPU工作負(fù)載的布局。而單核/單片平臺對大工作負(fù)載是有效的,但對于小工作負(fù)載的效率很低。因此,Imagination的靈活多變的動態(tài)的多核架構(gòu),可以把大的工作負(fù)載來細(xì)分,切分成不同的小的工作負(fù)載,并且同時進(jìn)行操作。這對多樣性和靈活度來說都是有好處的。

同時從單核、多核趨勢角度來看,GPU的這種多核趨勢是和CPU之前的向多核發(fā)展的趨勢是類似的。所以此次發(fā)布的B系列是多核架構(gòu),它更加靈活,而且更加具有動態(tài)性,所以不僅僅能帶來更好的渲染/性能,同時降低了功耗,還有可以滿足chiplet(小芯片)需求。

image.png

圖 B系列從左至右,分別面向低、中、高和汽車應(yīng)用

2 Chiplet的趨勢

chiplet在GPU行業(yè)里是個主流趨勢,無論是英偉達(dá)還是AMD都在進(jìn)入這個領(lǐng)域。所以imagination非常合理、也非常有必要地要賦能客戶實現(xiàn)chiplet能力。

chiplet的出現(xiàn)是因為現(xiàn)在處理器的成本非常高。與傳統(tǒng)的1個處理器來負(fù)責(zé)1個性能點的做法不同,chiplet架構(gòu)由不同的組件構(gòu)成,然后在獨立的軟件上進(jìn)行設(shè)計和執(zhí)行。因此,不同的chiplet可以用不同的工藝節(jié)點來制造,甚至可以由不同的供應(yīng)商來提供,這樣可以減少設(shè)計時間和成本。

但是chiplet有個問題:在裸片之間信號的傳輸可能會受限制,所以Imagination的多核架構(gòu)和去中心化措施堪稱完美的解決方案,解決了大量的信息集中到單一模塊上的這種問題。這種去中心化的多核架構(gòu)很好地符合了chiplet的趨勢。從客戶那里獲得的反饋是性能有大幅提升,也不存在裸片之間的信號傳輸問題。

image.png

圖 BXT系列GPU是1個4核部件

3 與主流GPU芯片的對標(biāo)

B系列GPU IP面向桌面級和數(shù)據(jù)中心,對標(biāo)的是友商的哪款GPU芯片?

實際上很難直接去對標(biāo),因為IP和芯片有不同的評測方式。要等采用了IP的芯片出來之后才能去跑分。目前來看,一個量化指標(biāo)是TFLOPS(每秒萬億次計算)。IMG B系列可提供高達(dá) 6 TFLOPS的計算能力,并通過多核技術(shù),支持更高性能。

另一個指標(biāo)是每瓦性能表現(xiàn)。PC等桌面高端顯卡高峰時的功耗達(dá)到幾百瓦,這是可接受的,但有些應(yīng)用,例如數(shù)據(jù)中心很難接受,因其自然散熱條件不能充分散熱,只能通過被動方式散熱,例如會把頻率降低,從而使功耗低一些。在這樣的場景下,Imagination的優(yōu)勢可以體現(xiàn)出來,因為Imagination的GPU IP傳統(tǒng)上是為移動產(chǎn)品應(yīng)用的,基本上就是幾瓦,這樣來看B系列在功耗上更有優(yōu)勢。

從圖形角度來看,Imagination不能像市面上的GPU芯片公司一樣直接比TFLOPS,因為這不準(zhǔn)確,僅供參考,因為還要有結(jié)合的場景。但至少Imagination有信心:做桌面級的處理是沒有問題的,B系列也能達(dá)到TFLOPS。

目前,在桌面GPU和云端平臺上,已經(jīng)有5家中國客戶在與Imagination接洽。

4 汽車電子的獨特需求

B系列的上代——A系列不是按照應(yīng)用劃分,而是性能。B系列有專門面向汽車應(yīng)用的子系列BXS。為什么要把汽車部分單獨提出來?這和A系列運用于汽車的產(chǎn)品之間的區(qū)別是什么?

Imagination有多年和汽車行業(yè)伙伴的合作經(jīng)驗,也了解到汽車行業(yè)的工作特點,所以才將之前幾代的GPU IP進(jìn)行了調(diào)整,來更加適合汽車行業(yè)。

首先,性能方面。消費產(chǎn)品用內(nèi)核市場與汽車行業(yè)是完全不同的,消費行業(yè)的流程是:內(nèi)核會有一個內(nèi)存的請求,然后進(jìn)入到SoC,之后再進(jìn)入到DDR,再回去。

但是汽車行業(yè)不同。汽車業(yè)SoC的很多操作是要實時進(jìn)行的,這就對內(nèi)存控制等優(yōu)先級要求很高,要求低延遲,比消費產(chǎn)品市場有2倍的提升。Imagination設(shè)計的GPU架構(gòu)允許這樣的延遲的提升。

另外,汽車行業(yè)的圖像渲染要求和游戲、消費類行業(yè)也不太一樣。在汽車行業(yè),自動駕駛所需要的圖像渲染的能力更加簡單直接,所以BXS從幾何渲染的角度進(jìn)行了微調(diào)。

再有,要確保GPU IP能完全滿足ISO26262標(biāo)準(zhǔn)(如下圖)。

image.png

此外,BXS做了很多小的架構(gòu)方面的改進(jìn),來確保GPU能進(jìn)行自我檢測。為此,融入了很多GPU的自然冗余,以確保計算結(jié)果是正確的;同時能將一些誤判不回饋給系統(tǒng)。

最后,Imagination有RISC-V固件,還有基于CRC的動態(tài)數(shù)據(jù)的完全性保護(hù),例如Imagination在工具包里有很多工具來保證自動駕駛過程中的功能安全性。

在這個過程中,包括硬件的設(shè)計,駕駛軟件的設(shè)計,以及內(nèi)部的安全管理信息的開發(fā),以及和汽車行業(yè)伙伴的合作,使Imagination了解在汽車自動駕駛的過程中真正的工作負(fù)擔(dān)是什么,并了解從圖像渲染和計算算法方面是從什么角度來切入,這樣,通過微調(diào)才能真正實現(xiàn)滿足市場的所有需求。

但是相比之下,很多競品只將一個消費類產(chǎn)品的移動端內(nèi)核重新封裝,然后復(fù)制到汽車行業(yè),并不是一個真正的汽車行業(yè)的自動駕駛級別的解決方案。

而Imagination從根本上來實現(xiàn)內(nèi)核的改變,從安全性和驗證角度,將內(nèi)核進(jìn)行重新的改變,完全適應(yīng)汽車行業(yè)和自動駕駛和ADAS(高級輔助駕駛系統(tǒng))的需求。這才能為客戶提供最好的汽車行業(yè)的GPU IP內(nèi)核。

值得一提的,Imagination汽車行業(yè)的GPU團(tuán)隊并不是從Imagination整體的GPU團(tuán)隊中分離出來的一個小團(tuán)隊,而是一個獨立團(tuán)隊,與其他行業(yè)GPU IP團(tuán)隊并行工作。

那么,Imagination如何滿足無人駕駛產(chǎn)業(yè)的需求?

到目前為止,很多無人駕駛的測試平臺是通過桌面GPU的算法實現(xiàn)的,這種算法是浮點運算能力和神經(jīng)網(wǎng)絡(luò)計算能力。自動駕駛汽車要真正成熟,需要有異構(gòu)的計算平臺,即GPU+NNA的并行計算能力。Imagination的多核架構(gòu)可以滿足功能安全性,為自動駕駛市場提供功能安全性和靈活性的解決方案。

具體地,從功能安全性的角度,Imagination可以提供硬件級的保證。在汽車驗證過程中,Imagination的方案可以在核內(nèi)進(jìn)行。例如在異構(gòu)平臺上,即把GPU和神經(jīng)網(wǎng)絡(luò)加速器(NNA)整合到同一平臺上(如下圖),通過GPU的動態(tài)性能控制和多任務(wù)機(jī)制以及GPU和神經(jīng)網(wǎng)絡(luò)加速器(NNA)之間的協(xié)同工作機(jī)制,可以輕松地同步應(yīng)對圖形處理和AI計算任務(wù);再發(fā)展到自動駕駛,對算力有超高需求時,Imagination的多核NNA就可以充分發(fā)揮作用。

另外對于汽車行業(yè),性能也是非常重要的。自動駕駛汽車在行駛過程中會產(chǎn)生大量的熱,算法平臺需要在一定的性能下滿足功耗的降低,而Imagination的架構(gòu)在性能的優(yōu)化和功耗降低方面能滿足自動駕駛汽車行業(yè)的需求。

最后,Imagination在汽車行業(yè)有很多的合作伙伴,有的已有10~15年的合作經(jīng)驗,這些終端用戶無論是汽車主機(jī)廠還是汽車供應(yīng)鏈上其他的用戶,給了Imagination使用反饋,使Imagination能在汽車行業(yè)給出理想的解決方案。

5 下一代GPU IP的挑戰(zhàn)

在下一系列的產(chǎn)品中,就是C系列,如果性能持續(xù)保持或超過現(xiàn)在的增長速率,需要突破的關(guān)鍵技術(shù)大概會有哪些?

正如很多大型IT企業(yè)所提到的,就是工藝節(jié)點的問題。目前為止,在有限的空間里,晶體管的密度越來越高了,以滿足在有限的空間里實現(xiàn)我們想要實現(xiàn)的性能,無論是7 nm、5 nm還是3 nm。但是還有一些其他的挑戰(zhàn)。例如在有限的空間和帶寬內(nèi)提升性能,同時降低功耗。另外帶寬也是一個問題,在過去幾代的手機(jī)端已經(jīng)看到在功耗限制下,手機(jī)的性能提升也不那么明顯了,Imagination此次發(fā)布的B系列,在這方面有自己的建樹,Imagination在人工智能和光線追蹤這2個領(lǐng)域的技術(shù),也能為未來大規(guī)模提升性能模塊有一定的幫助。

image.png

6 中國市場如何降低專利風(fēng)險

中美貿(mào)易摩擦導(dǎo)致中國公司在芯片領(lǐng)域有較大的風(fēng)險,貴公司如何幫助中國公司規(guī)避風(fēng)險?

中國的很多客戶在此前對美國技術(shù)有過分的依賴,但在中美貿(mào)易摩擦中無法進(jìn)口美國的技術(shù),而且美國對中國大量的技術(shù)出口的意愿也受到打擊。因此,中國企業(yè)要避免對美國技術(shù)的過分依賴,同時更快地發(fā)展中國本土的半導(dǎo)體產(chǎn)業(yè)。

Imagination是少數(shù)擁有圖形處理基本專利公司之一,另一方面也是唯一一家非美國的擁有基本GPU IP的公司,所以可以非常合理地進(jìn)入到中國,與中國的合作伙伴進(jìn)行密切的合作。

7 是否成功取決于生態(tài)

Imagination的GPU IP可用于中國哪些市場?

這和生態(tài)系統(tǒng)有很大的關(guān)系。Imagination的客戶是芯片的設(shè)計者,以及客戶的客戶,取決于它們在某一個應(yīng)用市場。特別是AI,Imagination有異構(gòu)計算平臺來進(jìn)入AI邊緣或云端的計算,前提是云端或桌面AI級計算的應(yīng)用要能起來。所以每個垂直應(yīng)用的市場都需要一個完整生態(tài)的建立。

Imagination現(xiàn)在對生態(tài)的建立,特別是在中國的生態(tài)建立是非常重視的,公司目前在不斷地在招募新員工。

8 中國的芯片設(shè)計水平和歐美的比較

Imagination的IP在歐美的關(guān)系就是直接買賣。但中國公司或從業(yè)人員跟國外的不一樣,成熟度有差距,包括做SoC或大芯片,生態(tài)/軟硬件,以及設(shè)計高手等。

盡管國內(nèi)少數(shù)公司的設(shè)計高手的水平已經(jīng)超過國外的,但是大部分公司的團(tuán)隊成熟度還是跟歐美有差距。因此他們對EDA工具和IP提供商的依賴度很高。所以Imagination在中國的技術(shù)支持的方式和力量都不一樣,需要大量的現(xiàn)場支持,這還是針對常規(guī)的公司。國內(nèi)還有很多初創(chuàng)公司,很多人沒有production(生產(chǎn))的經(jīng)驗,所以要求Imagination的支持方式完全與歐美不一樣。歐美哪怕一個小的團(tuán)隊,設(shè)計能力和做事的成熟度也比國內(nèi)一些團(tuán)隊的成熟度高——但這不一定是說歐美公司就比國內(nèi)的厲害。因為一家公司是否成功,還涉及到第二點——企業(yè)的商業(yè)文化。國內(nèi)工程師可以做到996(員工上班時間從早上9點開始,到晚上9點下班,每周工作6天。),英國是絕對不可能的,美國也是極個別的公司才能做到996。

具體地,歐美成熟的fabless(設(shè)計芯片公司)購買產(chǎn)品,他們都按照規(guī)矩和流程,例如他們需要你的支持,怎樣支持。因為他們自己有非常清晰的怎樣做SoC項目的流程。

包括利潤率的要求也不一樣,歐美往往要求毛利不低于60%,歐美做的速度也有規(guī)律,他們不是看到你的這個產(chǎn)品賺錢,我也要去做這個。但中國是這樣的,如果這個賺錢,我就做,而且要快,快就變成了996。前不久還聽說了007(一天24小時待命,每周7天)。這是中國市場普遍存在的特點,而且即使他做不到,他也一定想這么做,因為如果產(chǎn)品雷同,他不這么做,根本活不了。

所以在這樣的要求下,Imagination的支持或客戶用IP的方式都不一樣。但是也正因為有這樣的文化,所以只要Imagination的產(chǎn)品是好的,他們確定是有價值的,他們就會采用。

中國的創(chuàng)新力也是驚人的。例如國內(nèi)某大型芯片設(shè)計公司,劉國軍副總裁一二十年前在一家美國EDA公司時,就跟該公司打交道,美國人不能相信一個剛出來的設(shè)計方法,該公司居然花了不到1年的時間,使用的效果超過了Cisco。

為此,劉國軍副總裁一直跟英國、美國人講這個故事,這家國內(nèi)芯片公司當(dāng)時不去花錢買顧問服務(wù),當(dāng)時的產(chǎn)品手冊全是紙質(zhì)的,有1尺高,該公司的工程師白天黑夜地去摳那些東西,最后用出來的效果超過了預(yù)期。

所以中外的商業(yè)文化不一樣。

那么,相比歐美,中國的方式更好嗎?這很難評判。因為歐美的流程的效率其實挺高的,他們做出來的東西基本上不太會同質(zhì)化。

但是你說這不好嗎?國內(nèi)企業(yè)就是能做出來歐美人都不敢相信的事情。

所以針對B系列,國內(nèi)企業(yè)會把Imagination的東西用起來,這沒問題;其次,這個用法跟歐美不一樣,所以Imagination的支持方式要努力適合國內(nèi)的特點。



關(guān)鍵詞:

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉