CPU+GPU=UPU:中微電全新處理器架構問世!
隨著視頻處理增多,CPU和GPU的融合成為一種趨勢。深圳中微電科技有限公司(ICube)創(chuàng)新了一種“中國芯”——UPU(和諧統(tǒng)調處理器,unified processor unit)技術,特點是把CPU和GPU兩種異質核統(tǒng)一在一個芯核內,并采用獨有的不犧牲效率的多線程技術。
圖1 CPU+GPU的演進圖 (MVP是multi-thread virtual pipeline,多線程虛擬流水線)
中微電不僅提供UPU IP,還提供芯片,其IC1是第一個基于UPU的移動系統(tǒng)芯片,已于去年推出工程樣片[1],主頻600MHz,是雙核-8線程。預計明年底推出IC2芯片,主頻1GHz,四核-16線程。去年,中微電還與深圳一家公司聯(lián)合申請了國家的核高基項目。
GPU與CPU的融合
把CPU和GPU真正的融合在一個芯片里,這種融合不僅是硬件的融合,還有軟件和完整的工具鏈,例如中微電有自己的指令集和Ithreads、Pthreads,可以進行GPU、CPU的軟件調用。這樣,客戶不用管具體應用,GPU任務來后,中微電的軟件自動分配給幾個線程,并支持OpenGL。
中微電的IP有單核-4線程,雙核-8線程,未來將有四核16線程。每個線程相當于一個標準的GPU或CPU核。16個線程做處理時,多任務情況下,可相當于16個SMP(對稱多處理)核;如果是單任務,可以進行并行計算,即通過Pthreads,把多線程全部作為一個并行計算的硬件載體來進行運算。例如,在中微電的實驗室里,“只用一個雙核8線程,能夠把軟件的并行計算、視頻的解碼(軟的)等用多線程實現出來?!?br />
中微電公司業(yè)務拓展副總裁曹安生稱,相比市面上SoC芯片的CPU核(ARM或者MIPS),中微電的核效率較高。例如要執(zhí)行GPU任務時,客戶還要License(獲得授權)另外一個GPU的核。而要做視頻的編解碼時,還要再License一個視頻硬核,所以是一個CPU核、一個GPU核,之后再封裝在一起。如果要想GPU的能力越強,GPU核就越多。未來x265標準出來,它License的視頻硬核是定死的,因此處理能力會受限。
一個UPU核有4個線程,相當于有4個SMP核,因此可以多任務、在不同的線程上跑。“當跑視頻時,通過這四個線程,把算法并行化,就可以在四個線程上用軟件來做?!?br />
那么,相對于硬件,軟件是否會引發(fā)功耗升高?曹安生稱功耗會稍微高一點,但是可以接受的范圍。軟件的好處在哪兒?靈活性.“我們的軟件可以并行化。例如現在可以是雙核-8線程。如果未來推出四核-16線程,如果你有新的算法,也沒問題,只要是把這個軟件并行了之后,你在網上下載一些你現在格式就OK了?!?br />
UPU體現靈活
首先,線程既可執(zhí)行GPU任務,又可當CPU。4個線程的好處是靈活,例如玩游戲時,CPU的任務很少。那我就可以把4個線程拿出來作為GPU的1個處理器,它的旁邊如果再配一些固定的配置,就組成了完整的GPU。
圖2 UPU和諧統(tǒng)調的流程
任務動態(tài)地在線程之間分配,哪幾個做CPU,哪幾個做GPU。但是有GPU任務時,優(yōu)先滿足GPU,剩下的那些線程可以執(zhí)行CPU的任務。當GPU把任務結束了,那些線程又可以來執(zhí)行CPU的任務。
性能強大
IC1是中微電的第一款產品,據曹安生介紹,其GPU的能力比Mali-400 GPU不遜色,或者更強(注:指核的比較,Maili有單核和雙核產品)。
據中微電評估,IC1 600MHz與ARM Cortex-A9雙核1GHz比,ARM制程是40nm,中微電是65nm。對于CoreMark指標,中微電的單核是2580,雙核就是5160;Cortex-A9雙核不到3000。功耗方面,用MVP核來比較,一點都不差,甚至還更好。
圖3 IC1——1雙核-8線程
開發(fā)環(huán)境放心
中微電有自己完整的編譯器,這歸功于中微電的編譯器的專家——Fred Chow,曾是MIPS科技公司的創(chuàng)始人之一,主持過MIPS的Open64編譯軟件設計。
因此,如果客戶是用C語言寫的,之后在ARM環(huán)境上面來編譯或運行,其源代碼可以在中微電的編譯器上編譯,就能在中微電的UPU上運行了。
與ARM、MIPS較量的機會
“非常坦率地講,我們面臨一個非常大的問題,不在于我們的性能怎么好,而在于生態(tài)鏈的競爭?!崩顝└φf。
但中微電的生態(tài)鏈也在慢慢的完善、改善。好消息是,Google在推LLVM(底層虛擬機器,Low Level Virtual Machine),如果能推廣的話,以后所有的基于LLVM的應用,跟下面CPU的架構是無關的。那時,用ARM、MIPS,或中微電UPU上跑的應用都是一模一樣。如果這個生態(tài)鏈能夠完善,用戶就看什么?比如中微電的四核-16線程,相當于16個核,如果不超過20美元,競爭對手是四核-30美元或者更高,用戶的選擇會顯而易見了。
據悉,中微電基于LLVM做了很多工作,因此客戶基于LLVM應用開發(fā)的,在中微電的核上馬上就可以運行?!拔覀儓孕牛坏絻赡暌院?,Google-LLVM的生態(tài)鏈一定會很好?!?br />
除了移動,中微電還關注一些跟生態(tài)鏈關聯(lián)不是很大的行業(yè),可能就用Linux的,例如無線服務器、路由器,特點是處理器要用到多任務。
圖4 IC2——四核-16線程
與大企業(yè)競爭,需要穩(wěn)扎穩(wěn)打
如果把時光倒退十年,MIPS肯定比ARM強,我們不要看一家企業(yè)今天如何強大。任何企業(yè)都有一個發(fā)展過程。如果用過程的觀點來看待一家企業(yè),“我們認為最重要的是技術,是競爭對手沒有的技術架構。”因此,中微電正在積蓄力量,等待用“中國芯”突破。
參考文章:
[1]第一個基于65納米的SOC產品IC1流片了.(2011-3-29).http://icubecorp.com/zh/2011/03/icube-corporation-today-reached-a-milestone/
照片 “深圳集成電路創(chuàng)新應用展”的中微電展位:不太起眼,但“山不在高”,中微電的UPU很不俗
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
c語言相關文章:c語言教程
路由器相關文章:路由器工作原理
路由器相關文章:路由器工作原理
評論