熱門芯片亮點(diǎn)
別讓芯片過(guò)熱
8月14~16日,在Stanford大學(xué)召開(kāi)的為期三天的第17屆熱門芯片展(Hot Chips 17)落下了帷幕?;仡櫛緦谜褂[,展品范圍廣泛,從科研前沿到流行商用芯片應(yīng)有盡有,本文很難面面俱到(可瀏覽www. hotchips.org/hc17),僅就當(dāng)前的亮點(diǎn)作一概覽。
今年的熱門芯片展上展出了IBM的游戲機(jī)控制臺(tái),并進(jìn)一步披露Cell處理器的結(jié)構(gòu),微軟談了Xbox360系統(tǒng)的某些的細(xì)節(jié),Toshiba介紹了為PlayStation 3配套的超級(jí)I/O芯片,還有IBM關(guān)于其寄存器的數(shù)據(jù)操作細(xì)節(jié)、器件連接總線和編程模塊等展項(xiàng)。
會(huì)展程序的安排反映了當(dāng)前研發(fā)的主體,正轉(zhuǎn)向可配置邏輯和渾然不于傳統(tǒng)馮尼曼主流結(jié)構(gòu)的處理器。Telairity, Philips, Cradle和Tensilica (軟核IP)等公司研制出各有自己獨(dú)特解決方法的媒體處理器。
在前沿技術(shù)方面,Luxtera令聽(tīng)眾第一次窺見(jiàn)用調(diào)制激光所生產(chǎn)的硅片結(jié)構(gòu)。環(huán)形調(diào)制器生成的半徑為30_m的硅結(jié)構(gòu)準(zhǔn)備用于生產(chǎn)可微調(diào)的光學(xué)濾波器。
另一個(gè)非??岬男录夹g(shù)是用超導(dǎo)和Josephson結(jié)研制的40GHz的高頻邏輯開(kāi)關(guān),用于控制無(wú)損耗超導(dǎo)中傳送的量子脈沖信號(hào)。其極終目標(biāo)是要制造超帶寬的微型控制器件。雖然這項(xiàng)技術(shù)今天還正在開(kāi)發(fā)之中,但是感到美中不足的是,為保持超導(dǎo)所需的7K低溫,所需制冷設(shè)備太過(guò)笨重。
離不開(kāi)摩爾定律
Intel技術(shù)與生產(chǎn)部總經(jīng)理Bill Holt回顧Intel半導(dǎo)體技術(shù)發(fā)展的歷程時(shí)說(shuō),Intel持續(xù)地保持著大約每?jī)赡晡㈦娮蛹夹g(shù)前進(jìn)一個(gè)階梯的速度,印證了摩爾定律的正確。而且預(yù)計(jì)最近若干年內(nèi)還會(huì)出現(xiàn)幾次這種微電子技術(shù)的階躍。
Holt指出當(dāng)前微電子的生產(chǎn)技術(shù)向多核結(jié)構(gòu)轉(zhuǎn)移,其背后的秘密與降低硅片的功耗密度有關(guān)。雙核處理器使每個(gè)核的工作電壓與頻率降低,而管芯面積翻番。于是,原來(lái)集中在單核管芯的功耗不僅得以降低并且還被分散于倍增的面積之上。
改變特定電路的設(shè)計(jì)也能降低局部的熱力集中。將電路分成兩個(gè)半速的功能塊,可以降低每個(gè)功能塊的峰值功率,且將功耗分散于較大面積的管芯之上。代價(jià)是需用雙倍的晶體管和較大的管芯面積。如果使用90nm或更先進(jìn)的工藝,將大量的晶體管集成于相對(duì)較小硅面積的余地越大。
Intel沒(méi)有走大力降低功能塊功率的道路,而是繞過(guò)去對(duì)時(shí)鐘電路加以控制??墒菍?duì)時(shí)鐘電路的控制并不能改變晶體管的靜態(tài)漏電流。為切斷漏電流需增加“睡眠”晶體管,像高速緩存器那樣集中地切斷大型晶體管的電源線和底線。但是它們的再次上電,需要增加一個(gè)以上的額外時(shí)鐘周期。Holt說(shuō),這項(xiàng)技術(shù)已用于整塊的高速緩存。那里需要更多的時(shí)鐘周期,然而切斷電源的時(shí)間往往是數(shù)倍于此時(shí)間的。
增加額外時(shí)鐘周期的主要原因是因連線的RC延遲。改進(jìn)連線結(jié)構(gòu)使電路靠得更近,改進(jìn)管芯集成策略將硅層3維疊置。這種將同樣的管芯上下疊置,可能是制造多核處理器和相應(yīng)SoC的更好更快的途徑。這種想法與Sun公司的臨近連接的研究課題有些相近。
Xbox360結(jié)構(gòu)設(shè)計(jì)
微軟對(duì)即將面世的Xbox360游戲控制臺(tái)系統(tǒng)作了進(jìn)一步介紹,并在一臺(tái)Xbox360的開(kāi)發(fā)系統(tǒng)上進(jìn)行演示。微軟是在多核策略的基礎(chǔ)上構(gòu)建Xbox360的。微軟表示其設(shè)計(jì)目標(biāo):旨在向游戲程序的開(kāi)發(fā)者提供一個(gè)強(qiáng)大而價(jià)格又是可接受的平臺(tái)。功能強(qiáng)大的3核處理器是一個(gè)便于開(kāi)發(fā)的對(duì)稱多處理器方案,微軟使用OpenMP實(shí)現(xiàn)線程API。3核處理器附有1MB的 L2 高速緩存和總數(shù)為1.65億只晶體管。
Xbox360 有512MB統(tǒng)一的DDR3 DRAM 存儲(chǔ)器,連接到圖形處理單元(GPU) (見(jiàn)圖1)。它不同于Sony的PlayStation 3 游戲站的設(shè)計(jì)。Sony的設(shè)計(jì)中,存儲(chǔ)器是分散于多核處理器和GPU之間的。分散存儲(chǔ)器的好處是各有自己專用帶寬的存儲(chǔ)器,但缺點(diǎn)是封裝的引腳多、硅片集成度低、存儲(chǔ)器劃分固定和高價(jià)位。而統(tǒng)一存儲(chǔ)器的好處是,可以按需要在處理器之間重新劃分,但是,在設(shè)計(jì)Xbox360時(shí)必須考慮到處理器與主存儲(chǔ)器之間的較長(zhǎng)延時(shí),應(yīng)采取措施進(jìn)行補(bǔ)償。
Xbox360使用了一種技術(shù)使每個(gè)CPU核的數(shù)據(jù)流只進(jìn)入自己的數(shù)據(jù)緩沖L1,避免多次出入高速緩存L2,攪亂那里的正常數(shù)據(jù)流 (見(jiàn)圖2)。每個(gè)CPU核處理結(jié)束后的流才送到3核共用的L2 。GPU使用IBM設(shè)計(jì)的高速點(diǎn)-點(diǎn)連接,直接從3核共用的L2取到正確的數(shù)據(jù)流。采用這樣的流數(shù)據(jù)編程模式,使程序員能以最少的讀和寫數(shù)來(lái)節(jié)約存儲(chǔ)器的帶寬。
每個(gè)CPU核模塊將圖形/文字的數(shù)據(jù)流送到L1 數(shù)據(jù)高速緩存,經(jīng)整理后再送入共用的1MB L2高速緩存。 GPU 直接從L2 獲得數(shù)據(jù)流,免除多余的對(duì)DRAM主存的讀/寫
所有CPU核所用的高速緩存的位寬為128b。 L2高速緩存具有靈活的指令集能對(duì)確定的指令與數(shù)據(jù)加鎖,如微軟設(shè)計(jì)的VMX SIMD單元有專門擴(kuò)展的指令。它包括有點(diǎn)積和支持同GPU相共享的Direct3D API 數(shù)據(jù)格式。今年10月由In-Stat《微處理器報(bào)告》主辦的“秋季處理器論壇”上,對(duì)于Xbox360 還會(huì)有進(jìn)一步的介紹。
ATI所設(shè)計(jì)的GPU (見(jiàn)圖3)具有48個(gè)并行的工作于500MHz的統(tǒng)一分色器核。每個(gè)核均支持32位的IEEE浮點(diǎn)運(yùn)算。它是對(duì)每條指令都能進(jìn)行向量、標(biāo)量、和紋理運(yùn)算的超標(biāo)量結(jié)構(gòu),每秒鐘能執(zhí)行240億次分色器指令。其他可列出的峰值技術(shù)規(guī)范還有:全速時(shí)的每秒40億次的像素運(yùn)算、每秒80億次的雙向線性采樣率、以及每秒5億次的有關(guān)于三角形的幾何運(yùn)算。
著眼于效率,CPU核可以工作于GPU的從機(jī)模式。為了及時(shí)提交3D圖像,必須使圖像跟上視頻刷新的時(shí)間要求,經(jīng)常需運(yùn)行于最高優(yōu)先級(jí),各CPU核應(yīng)竭盡全力保證所提供的流水線能夠避免出現(xiàn)不自然的人為痕跡(如不完整的紋理組織)和屏幕更新的呆滯,總之,不允許干擾畫面的真實(shí)感和游戲的沉迷感。
Xbox360芯片要在不同的90nm工廠生產(chǎn)。微軟希望以后能把管芯的尺寸縮小,并移植到下一代生產(chǎn)工藝的流水線上去生產(chǎn),從而降低游戲機(jī)控制臺(tái)的價(jià)格。
并非事必“多核”
盡管Intel對(duì)于多核處理器和Xbox360作過(guò)許多正面的宣傳,外界也有許多將多核處理器用于家用PC、游戲控制臺(tái)、和其它消費(fèi)設(shè)備的多種設(shè)想,然而,也有一種聲音在說(shuō):皇帝沒(méi)穿衣服!對(duì)熱點(diǎn)芯片發(fā)表這樣基調(diào)的,有Nvidia公司的主要科學(xué)家David Kirk,他指出,今天尚缺乏能有效使用多核處理器的內(nèi)容(如游戲的節(jié)目)!幾乎同時(shí),John Carmack——Id軟件公司的合伙創(chuàng)立人、技術(shù)主任和編程老鳥(niǎo),在一次有關(guān)計(jì)算機(jī)游戲的聚會(huì)時(shí)談到,用現(xiàn)行的軟件方法和工具要想使多線程游戲程序正確地工作是很困難的。還指出,對(duì)于PC,除去應(yīng)用代碼問(wèn)題之外,驅(qū)動(dòng)程序也得改進(jìn)。一般來(lái)說(shuō),編寫常規(guī)的串序執(zhí)行程序,游戲程序的編程人員需要花費(fèi)多年時(shí)間才能對(duì)一種處理器體現(xiàn)出優(yōu)化。將代碼拆分成多核執(zhí)行的形式,又得重新進(jìn)行優(yōu)化,它們都需要時(shí)間和重新加以研究和探討。
多線程編碼的部分問(wèn)題還在于,現(xiàn)在最常用的語(yǔ)言對(duì)于揭示出并行性的能力很弱。Kirk也相信,對(duì)此問(wèn)題,目前還沒(méi)有足夠的主流研究和教育部門的關(guān)注。超級(jí)計(jì)算機(jī)界的研究者和專業(yè)軟件界的編程者可能都不會(huì)同意這種多核的主張,因?yàn)樯袩o(wú)多線程方面的擴(kuò)展研究;再者,多線程也未形成主流研究課題。誠(chéng)然,多核PC和游戲控制臺(tái)將來(lái)會(huì)促使多線程編碼成為一個(gè)主流研究課題。
上述問(wèn)題會(huì)獲得解決的一個(gè)信號(hào),是Intel, Microsoft, 和Cell計(jì)算機(jī)的伙伴(IBM/Sony) 提供了多核處理器的改良軟件工具。當(dāng)程序人員學(xué)會(huì)如何有效使用多核技巧的時(shí)候,相信抱怨定會(huì)減少。(摘自美國(guó)Microprocessor Report,梁合慶譯)
評(píng)論