徹底釋放運算能力 處理器邁向異質(zhì)系統(tǒng)架構(gòu)
“傳統(tǒng)處理器架構(gòu)受限GPU運算能力,故在硬體開發(fā)上有許多限制,而異質(zhì)系統(tǒng)架構(gòu)則可以讓CPU、GPU和其他處理器協(xié)同運作于單一晶片與單一記憶體位址,并順暢分配工作,讓最適合的單元處理特定任務(wù),以提高效能并降低功耗。
本文引用地址:http://m.butianyuan.cn/article/192514.htm行動運算(MobileComputing)與云端運算(CloudComputing)時代已然到來,次世代運算技術(shù)也正開始其革命性的轉(zhuǎn)變,過去幾年間,異質(zhì)系統(tǒng)架構(gòu)(HeterogeneousSystemArchitecture,HSA)儼然成為趨勢,并將成為現(xiàn)今最受歡迎的智慧聯(lián)網(wǎng)裝置的主導(dǎo)架構(gòu)。
傳統(tǒng)系統(tǒng)架構(gòu)對軟體創(chuàng)新有諸多限制,異質(zhì)系統(tǒng)架構(gòu)則正視軟體開發(fā)者的需求,提供一個可貴的跨平臺、跨作業(yè)系統(tǒng)方案,讓各種應(yīng)用程式開發(fā)者能更盡情開發(fā)各種軟體,發(fā)展出高效能、低功耗且最能順應(yīng)時代快速變遷的解決方案。傳統(tǒng)處理系統(tǒng)架構(gòu)并非著重于繪圖處理器(GPU)運算能力的完全釋放,故在開發(fā)上有諸多限制。異質(zhì)系統(tǒng)架構(gòu)的目標(biāo)則是使中央處理器(CPU)與GPU間如陰與陽般完美協(xié)同運作,讓程式開發(fā)者能使用各種硬體,盡情地開發(fā)出高效能、低功耗且能順應(yīng)快速變動的使用者需求的解決方案。
異質(zhì)系統(tǒng)架構(gòu)加速軟體開發(fā)進度
異質(zhì)系統(tǒng)架構(gòu)是指系統(tǒng)可讓包含CPU、GPU在內(nèi)的不同運算單元能在單一晶片上和諧運作,順暢移動并分配工作,讓最適合的單元處理特定工作任務(wù)(圖1)。
圖1 異質(zhì)系統(tǒng)架構(gòu)示意圖
異質(zhì)系統(tǒng)架構(gòu)聚焦軟體開發(fā)者需求,設(shè)計跨平臺裝置以及通用的硬體平臺。另外,異質(zhì)系統(tǒng)架構(gòu)的概念系期望打造一個單一架構(gòu)規(guī)格并簡化程式開發(fā),協(xié)助軟體開發(fā)業(yè)者進一步發(fā)揮現(xiàn)今GPU的絕佳優(yōu)勢,并透過搭載于異質(zhì)性處理器內(nèi)的平行運算引擎,徹底釋放更佳的效能并提升用電效率。
基于異質(zhì)系統(tǒng)架構(gòu)的標(biāo)準化異質(zhì)性編程模式,讓開發(fā)者在可負擔(dān)的成本下更容易推動客制化的軟體,并于現(xiàn)今達555億美元且持續(xù)成長的異質(zhì)性處理器(亦即混合式處理器)市場中獲益。異質(zhì)系統(tǒng)架構(gòu)簡化平行運算的軟體開發(fā),讓軟體工程師能盡情運用異質(zhì)系統(tǒng)架構(gòu),開發(fā)其所需要的客制化產(chǎn)品。
業(yè)界廠商與異質(zhì)系統(tǒng)架構(gòu)基金會將協(xié)助開創(chuàng)軟體創(chuàng)新的新時代,打造前所未有的使用者經(jīng)驗,提升云端資料管理、串流傳輸以及資料安全等。
CPU/GPU共享同一記憶體空間hUMA標(biāo)準解決處理器運算難題
異質(zhì)運算系統(tǒng)架構(gòu)結(jié)合CPU上的純量處理和GPU上的平行處理能力,訴求系統(tǒng)中的CPU、GPU協(xié)同運作,為達此效率,GPU的系統(tǒng)記憶體存取方式已有了顯著的改變。
傳統(tǒng)處理器設(shè)計中,CPU和GPU各自獨立運作,且各具獨立的記憶體空間,讓處理器有許多無效率及效能瓶頸的情形。
為解決CPU與GPU記憶體空間各自分立的運算問題,業(yè)界提出一項新技術(shù)--異質(zhì)運算架構(gòu)統(tǒng)一記憶體存取(heterogeneousUniformMemoryAccess,hUMA)。
透過hUMA,CPU和GPU能共享并存取同一個記憶體空間,GPU亦可直接存取CPU的記憶體位址,如圖2所示。
圖2 hUMA運作示意圖
hUMA架構(gòu)可以讓GPU完全存取CPU的記憶體位址,并且讓CPU和GPU在記憶體空間上所讀取的資訊保持一致。CPU只須移動指標(biāo)(Pointer)將相關(guān)資訊傳遞到GPU,GPU便可以直接存取資料,毋須等待CPU將內(nèi)容復(fù)制到GPU的記憶體,此舉可以避免不必要的位址錯置或功耗浪費。
hUMA帶來的硬體一致性,包含以下三個主要功能:
.一致記憶體
確保CPU和CPU快取記憶體可以同步看到最新的資料數(shù)據(jù)。
.分頁記憶體
允許GPU順暢的存取(還)沒出現(xiàn)在實際記憶體(PhysicalMemory)中的虛擬記憶體位址。
.整體記憶體空間
CPU和GPU都可以存取并分配系統(tǒng)虛擬記憶體空間內(nèi)的任何位置。
推廣異質(zhì)運算技術(shù)HSA基金會誕生
異質(zhì)系統(tǒng)架構(gòu)基金會成立于2012年,為一個獨立運作的非營利組織,對所有致力于新一代運算效能與能源效率的業(yè)者保持開放的態(tài)度,且歡迎具有前瞻性思維的半導(dǎo)體廠商、平臺供應(yīng)商、作業(yè)系統(tǒng)業(yè)者、裝置制造商、獨立軟體廠商(ISV)、學(xué)者與開放原始碼開發(fā)者共同參與,一同挑戰(zhàn)整個標(biāo)準系統(tǒng)架構(gòu),結(jié)合CPU、GPU、數(shù)位訊號處理器(DSP)及其他加速器,帶動運算基礎(chǔ)更加進步,使異質(zhì)性平行運算裝置的程式開發(fā)大幅簡化。
異質(zhì)系統(tǒng)架構(gòu)基金會正在透過免權(quán)利金詳細計劃書(RoyaltyFreeSpecifications)和開放源碼軟體來推動其計劃。異質(zhì)系統(tǒng)架構(gòu)基金會的成員針對異質(zhì)化運算推出性能強大的開發(fā)解決方案,利用開發(fā)工具、軟體開發(fā)套件(SDK)、函式庫、技術(shù)文件、培訓(xùn),以及支援方案等資源,來推動創(chuàng)新內(nèi)容與應(yīng)用,擴大異質(zhì)系統(tǒng)架構(gòu)的影響范圍。
目前的創(chuàng)始會員包括超微、安謀國際(ARM)、ImaginationTechnologies、聯(lián)發(fā)科、德州儀器(TI)、三星(Samsung)與高通(Qualcomm)。其余異質(zhì)系統(tǒng)架構(gòu)基金會成員還有Apical、Network-on-chip矽智財公司Arteris和Sonics、軟體工具公司MulticoreWare、影像開發(fā)專業(yè)公司和圖型與GPU計算科技公司Vivante,以及軟體外包商新必優(yōu)資訊(Symbio)。
看好HSA發(fā)展廠商興致勃勃
異質(zhì)系統(tǒng)架構(gòu)基金會總裁暨超微全球院士PhilRogers表示,異質(zhì)系統(tǒng)架構(gòu)帶領(lǐng)業(yè)界走出沿用25年以上、對軟體創(chuàng)新有諸多限制的傳統(tǒng)系統(tǒng)架構(gòu)。異質(zhì)系統(tǒng)架構(gòu)正視軟體開發(fā)者的需求,設(shè)計一個通用的硬體平臺,發(fā)展高效能且節(jié)能的解決方案。異質(zhì)系統(tǒng)架構(gòu)開創(chuàng)出全新的發(fā)展空間,含括個人電腦(PC)、智慧型手機、平板及超輕薄筆記型電腦(Ultrabook),以及創(chuàng)新的超級電腦與云端服務(wù),這些方案構(gòu)成現(xiàn)代運算經(jīng)驗的定義。
超微異質(zhì)應(yīng)用與開發(fā)解決方案部門全球副總裁ManjuHegde則指出,超微在1年多前率先宣布實踐異質(zhì)系統(tǒng)架構(gòu)理想的藍圖,并著手將CPU與GPU融合為單一處理引擎,打造為一個全新的設(shè)計架構(gòu),大幅簡化異質(zhì)化平臺的編程作業(yè)。
ARM院士暨媒體處理器部門技術(shù)副總裁JemDavies表示,人們對于連結(jié)到數(shù)位世界的科技需求日益升高,而圖形繪圖介面則是打造優(yōu)質(zhì)使用經(jīng)驗一個不可或缺的關(guān)鍵因素,但往往會因此影響系統(tǒng)整體的電力表現(xiàn)。透過開放性產(chǎn)業(yè)標(biāo)準,開發(fā)者可在不犧牲電力效率下,提供最卓越的繪圖表現(xiàn)。
另外,ImaginationTechnologies行銷副總裁TonyKing-Smith也表示,Imagination長期以來一直認為異質(zhì)化處理架構(gòu)是未來系統(tǒng)單晶片(SoC)設(shè)計能發(fā)揮其擴充性、彈性與效能的重要基礎(chǔ)。結(jié)合CPU與功能日益強大的整合繪圖晶片,加上符合各種業(yè)界標(biāo)準的應(yīng)用程式介面(API),包括OpenCL、RenderscriptCompute與DirectCompute,將是邁向目標(biāo)的第一步。
HSA架構(gòu)APU下半年現(xiàn)身
超微正以其開發(fā)加速處理器(APU)的專業(yè)經(jīng)驗,結(jié)合異質(zhì)運算架構(gòu)標(biāo)準,為客戶打造出更高效能、更低功耗的處理器。超微將于2013年下半年推出第一款基于異質(zhì)系統(tǒng)架構(gòu)產(chǎn)品,代號為Kaveri的APU。
日前,超微也發(fā)表代號為柏林(Berlin)的伺服器APU,期望能提供卓越的每瓦運算效能,并造就高運算密度,柏林預(yù)定在2014年第一季問世。
hUMA智慧運算架構(gòu)前景看俏
異質(zhì)系統(tǒng)架構(gòu)被預(yù)期將為未來處理器設(shè)計的樣貌帶來巨大沖擊,因為異質(zhì)系統(tǒng)架構(gòu),GPU和CPU成為系統(tǒng)中平等的要素和參與者。
CPU不論現(xiàn)在和未來都將是串列工作的最佳處理單元,這表示現(xiàn)今很多應(yīng)用程式使用延遲敏感(LatencySensitive)的記憶體運算,而這些程式工作負載的設(shè)計有著串列和純量的分別,且其程式碼有著相當(dāng)多的分支。另一種程式碼則是盡可能地進行平行運算,此種程式碼有著數(shù)以萬計、甚至是數(shù)以千萬計重復(fù)的資料運算動作,而GPU極為適合此類運算。
透過hUMA帶來的智慧運算架構(gòu),將可順暢地分配相應(yīng)的工作任務(wù)至最適合的處理單元,使CPU、GPU和其他處理器協(xié)同運作于單一晶片和單一記憶體位址上,且順暢移動并分配工作,讓最適合的單元來處理特定工作任務(wù)。
評論