18歲CEO催生開放架構(gòu)平行處理器 提早實(shí)現(xiàn)exascale
在美國(guó)有一家由兩個(gè)青少年所創(chuàng)立的新公司 Rex Computing ,開發(fā)了一款平行架構(gòu)處理器,期望能為高階系統(tǒng)帶來10倍的每瓦效能提升;該公司并打算將指令集架構(gòu)轉(zhuǎn)為開放源碼,以拉攏支持者。
本文引用地址:http://m.butianyuan.cn/article/201609/304042.htm這家新創(chuàng)公司的雄心不小,最近終于到了可以自己簽公司合約年紀(jì)(18歲)的該公司執(zhí)行長(zhǎng)Thomas Sohmers的目標(biāo),是打造目前處理器與加速器的替代技術(shù)──現(xiàn)有的方案若要升級(jí)至研究人員期望在未來十年達(dá)到的exaflop等級(jí)性能,要付出的代價(jià)太高(主要是功耗方面)。
Sohmers 表示,運(yùn)算產(chǎn)業(yè)界面前是一條艱辛的長(zhǎng)路;大家廣泛接受的是繼續(xù)與英特爾(Intel)、Nvidia一起遵循摩爾定律(Moore's Law)路線往下走:“現(xiàn)在有一個(gè)很好的機(jī)會(huì)能讓我們能提早實(shí)現(xiàn)exascale等級(jí)系統(tǒng),我們需要的是很新的東西,我們也正在嘗試推廣它,不過這是一樁 困難的生意,很多人抗拒新的東西。”
最近Sohmers當(dāng)選為Facebook發(fā)起的開放運(yùn)算計(jì)畫(Open Compute Project,OCP)高性能工作小組共同主席;他預(yù)期Rex最快能在明年1月完成其Neo核心的開發(fā),并且透過OCP將該處理器架構(gòu)開放:“我們的想法是讓它成為一個(gè)基礎(chǔ)架構(gòu),讓其他人能利用它打造未來的系統(tǒng)。”
Neo核心架構(gòu)
Sohmers 透露這會(huì)是第一個(gè)全力實(shí)現(xiàn)晶片的OCP專案,其他成員將協(xié)助提供晶片互連、以及實(shí)際的Verilog、RTL等設(shè)計(jì)程序。3W的Neo處理器在80mm2 面積內(nèi)包含256個(gè)核心(核心架構(gòu)如上圖),每個(gè)核心具備64位元ALU、128Kbyte容量的SRAM暫存記憶體。
每個(gè)Neo核心之間有16Gbyte/s的互連,晶片之間的總頻寬約384 Gbytes/s。該處理器架構(gòu)的靈感來自于Adapteva 的Epiphany晶片,Sohmers 用它做出了第一代原型晶片,不過該原型的記憶體頻寬不夠、也達(dá)不到他想要的雙倍精度。
Rex Computing規(guī)劃的系統(tǒng)設(shè)計(jì)
Rex Computing規(guī)劃了一個(gè)系統(tǒng)設(shè)計(jì)(如上圖),只需利用三分之一的OCP 1U伺服器節(jié)點(diǎn),采用4x4的晶片陣列,由一個(gè)次元件來控制──該公司打算一開始采用FPGA方案;Sohmers表示,該設(shè)計(jì)可達(dá)到50 Gflops/watt、雙倍精度浮點(diǎn)運(yùn)算。
執(zhí)行Linux軟體的控制晶片能提供Neo陣列存取功能,并能以C語(yǔ)言編寫高度平行化的應(yīng)用程式;不過Sohmers強(qiáng)調(diào),要讓新架構(gòu)處理器充分發(fā)揮效能, 會(huì)需要用到一些新興的平行編程解決方案,例如Unified C或Erlang。該新架構(gòu)系統(tǒng)鎖定的應(yīng)用市場(chǎng)包括石油/天然氣探勘、機(jī)器學(xué)習(xí)等等,Rex Computing正在籌募種子基金,為Neo處理器投片做準(zhǔn)備。
在不久前的Supercomputing 2014大會(huì)上,Sohmers 與來自Cray、IBM、美國(guó)國(guó)家實(shí)驗(yàn)室的技術(shù)菁英們一起參與了一場(chǎng)座談會(huì),探討exascale 等級(jí)系統(tǒng)的未來發(fā)展;有人認(rèn)為,該類系統(tǒng)將會(huì)是遠(yuǎn)超過可預(yù)期的未來,部分原因是目前系統(tǒng)的性能都被高估了。
不過Sohmers認(rèn)為,全球 百大超級(jí)電腦仍是利用已經(jīng)有30年歷史的Linpack基準(zhǔn),根本無法強(qiáng)調(diào)記憶體頻寬或是模擬實(shí)際應(yīng)用;而HPCG (high-performance conjugant gradient)基準(zhǔn)是更實(shí)際的量測(cè),采用該基準(zhǔn)所列出的系統(tǒng)評(píng)比結(jié)果,只有Linpack基準(zhǔn)性能的60分之一,因此現(xiàn)今最強(qiáng)大的系統(tǒng)可能只有還構(gòu)不上petaflop等級(jí)的一半:“這真的很糟糕。”
評(píng)論