十問Chris Rowen:聽微處理器大師講SoC設(shè)計(jì)的前世今生
中國北京2010年6月11日訊–即便放眼整個(gè)IC行業(yè),像Chris Rowen博士這般愛談技術(shù),同時(shí)又可以講得如此深入淺出的,著實(shí)少見。他可以一邊舉起手中的iPhone做各種演示,也可以拿起隨手拾見的小紙條寫寫畫畫來加強(qiáng)語氣。他咬字無比清晰準(zhǔn)確(尤其在諸如Interestingly或者particularly這類副詞的時(shí)候會(huì)讀得緩慢甚而產(chǎn)生了某種韻律感),似乎是在運(yùn)用一種類似于詩人誦詩,抑或冒險(xiǎn)家在眾人面前娓娓道來諸多奇跡的情緒和語氣,來描述那些SoC設(shè)計(jì)的理念。很神奇。
而更加奇妙的是,他幾乎經(jīng)歷過微處理器的所有起起伏,前世今生。他是RISC架構(gòu)的奠基人之一,分別參與了Intel和MIPS公司的大躍進(jìn)時(shí)代,如今,又帶著一種全新SoC架構(gòu)的理念,在或多或少地改變著我們的數(shù)字時(shí)代。所以,與其說是采訪,還不如說是在聽一個(gè)傳奇(而且這個(gè)傳奇也不過是翩翩中年哦!)講故事。
Power Density、Parallel、Multi-Core、FPGA、RISC、SoC,這些詞于談笑間輾轉(zhuǎn)騰挪,有一瞬間,我差點(diǎn)覺得對(duì)面坐著的是 Wes Anderson,那個(gè)拍出過《了不起的狐貍爸爸》(Fantastic Mr. Fox)的我最中意的好萊塢導(dǎo)演。不避世也不趨世。獨(dú)辟蹊徑,信手拈來。關(guān)鍵都還挺帥的。
1、我看過您2004年寫的“復(fù)雜SoC設(shè)計(jì)”,非常喜歡的第8章(Chris Rowen :“SOC設(shè)計(jì)的未來”哈哈)。恩您還記得。因?yàn)槟愕乃蓄A(yù)言都應(yīng)驗(yàn)了,這非常有趣。所以我的問題是,您如何看待再6年之后的SoC設(shè)計(jì),或者說和SoC 設(shè)計(jì)有關(guān)的那些技術(shù)趨勢? (Chris Rowen :哇,這個(gè)問題還不賴?。?br />
Chris Rowen :我認(rèn)為這個(gè)市場的大方向還是相當(dāng)清楚的。看看市場層面的基本趨勢,再看看技術(shù)層面的基本趨勢,你就可以看到他們?cè)谀睦镏睾稀>图夹g(shù)而言,你會(huì)發(fā)現(xiàn)摩爾定律(Moore’s Law)作為經(jīng)濟(jì)驅(qū)動(dòng)力的事實(shí)。但是摩爾定律真正有趣的部分在于,第一,是“集成度(Density)持續(xù)提高”。每隔2年半或者3年,硅密度就要提高一倍,這意味著近一倍成本的降低,讓射頻產(chǎn)品中的數(shù)字模塊集成度越來越高。這也意味著,各種系統(tǒng)都在規(guī)模(Scale)上變得越來越小。所以無論是電腦亦或消費(fèi)電子設(shè)備,每一個(gè)系統(tǒng)的目的都是集成于同一塊芯片。這就變得有趣起來。因?yàn)樵谶^去,你可以生產(chǎn)通用(Generic)存儲(chǔ)器,通用處理器,通用射頻,諸如此類,然后一股腦兒放在一塊兒,建一個(gè)非常牛逼的專用(Specific)系統(tǒng)。但是在今天,事情都顛過來了。你更希望把一坨不同的功能集合到一塊芯片上。當(dāng)然在這個(gè)意義上,你還是得搞出一塊專用芯片。但是挑戰(zhàn)變大了,因?yàn)樾酒旧硇枰訉W⒂谀骋粋€(gè)特殊應(yīng)用,而應(yīng)用處理器、內(nèi)部總線等等其他玩意兒,也要變得更小更強(qiáng)更快!
另一件吊詭的事就是,摩爾定律并沒有在晶體管層面帶來太多的功率改進(jìn)。在過去,當(dāng)東西變小了,功率自然就降低了,所以工程師也壓根不需要操心什么芯片架構(gòu)(Architecture)。而現(xiàn)在,如果工程師想要優(yōu)化功耗,首先就要優(yōu)化架構(gòu)。他得考慮我怎么著才能更有效地完成這個(gè)計(jì)算?譬如用更少的晶體管門或者運(yùn)算周期,甚至在這個(gè)任務(wù)不運(yùn)行的時(shí)候關(guān)閉掉相應(yīng)子系統(tǒng)??傊?,這活兒變智能(Intelligent)了。
所以舉個(gè)例子啊,比如你想做個(gè)手機(jī),就必須要注意區(qū)分不同的使用場景,譬如聽音樂、看YouTube視頻、發(fā)短信、上網(wǎng),或者煲電話,這些都是完全不同的情景。你得關(guān)掉所有沒用的子系統(tǒng)。更細(xì)心,更積極。因此對(duì)于芯片設(shè)計(jì)師(Chip Architect)或者系統(tǒng)設(shè)計(jì)師來說,這是最好的時(shí)代。因?yàn)橛羞@么多的事兒可做。但對(duì)于一個(gè)晶體管工人(Transistor Guy)而言,這可真是最壞的時(shí)代??!一切都已經(jīng)上升,已經(jīng)上升到系統(tǒng)或者應(yīng)用的級(jí)別。這就是技術(shù)領(lǐng)域正在發(fā)生的大事件。
2、未來幾年市場方面的變化呢?
Chris Rowen :說到市場。我認(rèn)為最大的趨勢是一切都已經(jīng)移動(dòng)起來,因?yàn)槿藗兊纳罘绞揭呀?jīng)徹底改變了。當(dāng)你可以隨身攜帶那么多的設(shè)備,就會(huì)希望能夠持續(xù)地連接到互聯(lián)網(wǎng) 上。這種影響不僅表現(xiàn)在設(shè)備上,還表現(xiàn)在無線基礎(chǔ)設(shè)施,以及云計(jì)算上。而且經(jīng)濟(jì)層面的機(jī)會(huì),將會(huì)隨之變得非常,非常深遠(yuǎn)。因?yàn)槟銜?huì)看到,譬如在這種設(shè)備 (Chris拿起手里的iPhone開始演示)的層面,無線連接的帶寬起碼還要提高30倍。為了獲得足夠豐富的娛樂體驗(yàn),我們或許需要幾十甚至幾百兆比特 的帶寬。在世界每一個(gè)地區(qū),高端用戶越來越多。中國就是一個(gè)鮮活的例子。不光如此。在印度、南美、非洲、加勒比海地區(qū),人人都希望持續(xù)不斷地連接到互聯(lián)網(wǎng)。
所以,你必須很好地設(shè)定人們?nèi)找嬖鲩L的期望值。現(xiàn)在有10倍的寬帶人口增長每個(gè)人都有30倍的寬帶需求,因此就有了300倍的寬帶要求。而系統(tǒng)的每個(gè)層面都需要滿足這種需求。對(duì)于無線基礎(chǔ)設(shè)施制造商來說,他們的機(jī)會(huì)是巨大的。譬如華為。但是制造商是沒可能贏得300倍收入的。有可能獲得更多的收入, 但不是三百倍以上。因此,他們必須在得到大幅增加帶寬的同時(shí),大幅降低資金成本(Capital Cost)和經(jīng)營成本(Operate Cost)。
3、那么接下來在SoC設(shè)計(jì)上會(huì)有什么事情發(fā)生?
Chris Rowen :你可以看下無線基站作為例子。傳統(tǒng)意義而言,它們是昂貴的。你可以找些通用芯片、通用DSP、通用FPGA。可是今天,為了滿足對(duì)帶寬的要求,您需要更 多的高度定制的SOC,芯片平臺(tái)和軟件的需求也上升很快。所以這將使集成度更高,每塊芯片上集成更多的DSP,而每塊DSP上嵌入更多的軟件程序,甚至是 軟件內(nèi)容的爆炸性發(fā)展。
有趣的是,每部分網(wǎng)絡(luò)基礎(chǔ)設(shè)施(Network Infrastructure)的功耗都是巨大的。那么即便為綠色節(jié)能考慮,減少為更加緊密集成的系統(tǒng)都是異常重要的?;緦⒚黠@變小,這意味著整個(gè)基站 都可變成塔頂?shù)囊粋€(gè)小盒子,而不是……裝在塔頂可是簡單很多。
當(dāng)然在系統(tǒng)層面,你一旦降低成本以后降低功耗也就水到渠成。所以這兩者之間是一個(gè)非常良性的關(guān)系。關(guān)鍵是硅晶圓的集成。這也是Tensilica會(huì) 如此迅速成長成為世界領(lǐng)先的DSP內(nèi)核供應(yīng)商之一的原因。
甚至可以看到這種變化體現(xiàn)到了云計(jì)算上。因?yàn)楝F(xiàn)在你需要300倍的帶寬,也就相應(yīng)地對(duì)視頻服務(wù)、視頻壓縮、互聯(lián)網(wǎng)數(shù)據(jù)庫搜索、社會(huì)網(wǎng)絡(luò),如此等等, 都提出了更高的需求。而所有這些事情,真的都是很復(fù)雜的應(yīng)用程序呢。
不過有趣的是,他們都是些并行的應(yīng)用程序。這是個(gè)好消息。因?yàn)樵谟?jì)算機(jī)業(yè)已經(jīng)發(fā)生的一件事情便是,單個(gè)微處理器的速度已經(jīng)很難再提高了。Intel 在1990年,戲劇性地發(fā)現(xiàn)了單處理器性能呈指數(shù)增長的改善。但是他們也旋即發(fā)現(xiàn)當(dāng)處理器頻率達(dá)到約3.5到4GHz的時(shí)候,功率密度(Power Density)遇到了瓶頸。于是,他們開始嘗試多核技術(shù)。
還好人民群眾想做的事,基本都是天然就可以并行處理的。所以,你在做互聯(lián)網(wǎng)數(shù)據(jù)庫檢索(Internet Database Search)的時(shí)候,確實(shí)可以設(shè)置多內(nèi)核、多芯片,甚至多系統(tǒng)。因?yàn)槟愕牟樵冋?qǐng)求通常將被發(fā)往多個(gè)地點(diǎn)。所以在互聯(lián)網(wǎng)云計(jì)算的領(lǐng)域,運(yùn)用多核的機(jī)會(huì)無比 廣闊。
而且確實(shí)存在是一個(gè)問題,就是你如何在有效的MIPS指令內(nèi)獲得足夠低的功耗?;蛘哒f,如何在設(shè)計(jì)電池壽命最長的移動(dòng)設(shè)備,和最可擴(kuò)展的服務(wù)器之間 取得關(guān)聯(lián)?因?yàn)樗卸己凸挠嘘P(guān),而非峰值的性能。
4、那么Tensilica是如何來克服在功耗上的挑戰(zhàn)的?和競爭對(duì)手比起來又有何區(qū)別?
Chris Rowen :舉個(gè)例子。Tensilica贊同為特定的任務(wù)去優(yōu)化處理器。優(yōu)化流水線(Pipeline),優(yōu)化接口,優(yōu)化設(shè)計(jì)層面,然后把多個(gè)內(nèi)核放在一起,以建 立一個(gè)多核系統(tǒng)。這種優(yōu)化的能力將產(chǎn)生巨大的影響。我會(huì)在今天下午的會(huì)上談到這個(gè)稱作Turbo解碼器的專用(Specialized)處理器。 Turbo是一種特殊的算法,可以從嘈雜的噪聲中提取有用信息,在一個(gè)工作循環(huán)(cycle)內(nèi),這個(gè)解碼器可以執(zhí)行大約3萬次,哦對(duì)的沒錯(cuò)3萬次 RISK指令。是的,通用的壓縮(Compression)處理器只能執(zhí)行一次指令,而這個(gè)專用處理器可以執(zhí)行3萬次。當(dāng)然這是一個(gè)極端的例子,只是想表明當(dāng)你知道你的問題在哪里,你就可以做出很多令人難以置信的事情。并行,并因此難以置信的高效率。
同樣的原則可以適用于各個(gè)層面,適用于各種其他門類的專用DSP、無線接收器,適用于基帶和音頻的通用DSP,也適用于客戶意欲進(jìn)行視頻處理或其他 圖形壓縮、安全操作、網(wǎng)絡(luò)協(xié)議處理,以及廣泛應(yīng)用于射頻的深嵌入式控制(Deeply Embedded Control)。
Tensilica特別集中精力于那些能夠?qū)iT優(yōu)化的能力,以及真正方便使用多核的能力。而因此,我們從那些傳統(tǒng)的CPU老家伙們中區(qū)別了出來。譬如Intel、ARM、MIPS,或者其他什么人。他們都面臨一個(gè)相同的物理問題,摩爾定律在給了他們更多的晶體管之后,卻沒有給他們更好的功率控制,對(duì) 不對(duì)?
他們很少去考慮并行的問題。而與之相反,我們?cè)趹?yīng)用層面非常努力地工作,以期尋找到解決方案。在云計(jì)算那段,我們確實(shí)可以將任務(wù)分割成很多子任務(wù),但是當(dāng)我在這里玩游戲(Chris又一次拿起手里iPhone開始演示),我真的被限制了。你看,一個(gè)手指只能玩一樣?xùn)|西哈。因此在應(yīng)用處理器的層面,你 真的無法得到啥好處。MIPS、ARM,甚至還有Intel,都面對(duì)著這樣一個(gè)無法在當(dāng)前硅科技下有效完成多任務(wù)的問題。而那是我們擅長的。
我們看到這個(gè)市場在迅速增長,去年的出貨量增長了大約70%。然后我們會(huì)試圖進(jìn)入所有的DPP(Data-Plane Processor)領(lǐng)域,包括DSP、音頻視頻、安全,以及深嵌入式控制,這其實(shí)和應(yīng)用處理器的范疇離得很遠(yuǎn)。所以啊,我們常常會(huì)發(fā)現(xiàn)自己和MIPS、 ARM或Intel出現(xiàn)在同一塊芯片上。你知道吧,其實(shí)我們就是工廠的工人啊(Chris突然哈哈大笑)!因?yàn)橛羞@么多不同的處理器,在Date- Plane里又有這么多不同的任務(wù),那些小而高效的處理器會(huì)有很多機(jī)會(huì),很多接口(Socket)。
這種對(duì)于應(yīng)用處理器或者接口的互補(bǔ)性,甚至于可以讓應(yīng)用處理器在執(zhí)行類似于信號(hào)處理這種實(shí)時(shí)任務(wù)的時(shí)候,也完全關(guān)閉。或者比如多媒體應(yīng)用,應(yīng)用處理器當(dāng)然可以去做,但是如果我們優(yōu)化專用音頻DSP的話,將獲得4到5倍的效率。尺寸更小,單位時(shí)間內(nèi)的吞吐量卻更大。而且可以用如此多的音視頻處理器夠你 選擇。所以幾乎任何時(shí)刻,系統(tǒng)設(shè)計(jì)師或者SoC設(shè)計(jì)師都可以通過區(qū)別應(yīng)用場景的方式,來決定卸載(Off Load)哪個(gè)處理器。
這也是為什么我認(rèn)為我們可以在音頻方面取得這么大的成功。當(dāng)你正在設(shè)計(jì)一個(gè)手機(jī),或者閱讀顯示器,或者機(jī)頂盒,或者數(shù)字電視,或者數(shù)碼相機(jī),你會(huì) 說,啊,這里有一種場景需要我做大量音頻的工作。于是,把那種卸載很自然地就被設(shè)計(jì)到基本構(gòu)架里去了。
而且,我們可以為應(yīng)用層面的處理器自動(dòng)生成軟硬件,尤其是基于音頻和基帶的非常全面的軟件庫(Software Libraries)。因此,不管是老手還是菜鳥,在我們的店鋪里都能找到他們所有需要的軟硬件解決方案,以幫助他們最快地進(jìn)入市場。集成音頻、集成基 帶,或者其他各種功能。
5、那么Tensilica有什么具體的應(yīng)用嗎?
Chris Rowen :今天下午,我將討論一下移動(dòng)電話。這是一個(gè)巨大的市場,一個(gè)可以滿足之前所說帶寬需求的市場。特別是從當(dāng)前正從3G向4G升級(jí),大家都聚焦在LTE身 上。不僅因?yàn)長TE看上去很像是最后標(biāo)準(zhǔn)的勝者,也因?yàn)樗浅O馱iMax。我們已經(jīng)能夠提供參考設(shè)計(jì),幫助客戶建立他們自己定義的多核LTE手機(jī),在市 場中搶得先機(jī)。這只是一個(gè)我們進(jìn)入領(lǐng)域的實(shí)例。
我們也在做一個(gè)很類似的數(shù)字電視解調(diào)器。因?yàn)橛腥讼M葹橐苿?dòng)應(yīng)用又為起居室設(shè)計(jì)一種通用的數(shù)字電視接收器。這里有個(gè)很大的問題,就是全世界在視頻 領(lǐng)域有好多不同的標(biāo)準(zhǔn)和概念,而每個(gè)人都真心希望擁有一塊可以解決一切的視頻芯片。我們準(zhǔn)備來設(shè)計(jì)一塊。其實(shí)應(yīng)用一樣的原理,就是找些DSP和專用核,優(yōu) 化最密集的任務(wù),并充分利用我們最重要的能力——生成處理器的功率效率非常小,以及和世上最穩(wěn)定的通用DSP一樣易于編程的軟件工具。昨天晚上客戶還和我 們說,DSP如此招人待見的最主要原因就是可編程。譬如TI的那些DSP。我們同樣在努力使編譯器更強(qiáng)大,使程序模型簡單,使程序員更不操心。我們還微處理器的流水線設(shè)計(jì)上增強(qiáng)了視覺效果。這種架構(gòu)下要還能生成不正確的代碼,也怪難的。
因此,我們擁有一個(gè)非常高效的處理器。但是效率(Efficiency)這個(gè)詞值得商榷。傳統(tǒng)意義上而言,效率就是指最少的門數(shù)、最小的功耗,巴拉 巴拉。但效率也是將產(chǎn)品推向市場的時(shí)間。需要多少工程師才能部署好這個(gè)系統(tǒng)?每行代碼的成本是多少?每個(gè)工程師小時(shí)(Engineer Hour)所能帶來的收入?除了硅片層面的效率以外,這些同樣是測量效率的重要參數(shù)。我認(rèn)為我們?cè)谶@兩面都推動(dòng)得很好。剛才討論的那種架構(gòu),也特別適合在大量出貨的領(lǐng)域。移動(dòng)設(shè)備、客廳設(shè)備、數(shù)碼相機(jī),這些都是我們做得非常好的地方。這幾個(gè)領(lǐng)域四大廠商中的三位,十大廠商中的六個(gè)都是我們的客戶。
我們主要是在DPP方面擁有很強(qiáng)的知識(shí)積累,但同樣的影響也已經(jīng)開始在云計(jì)算上面出現(xiàn)。當(dāng)然,現(xiàn)在云計(jì)算的變化還比較慢,部分原因是它并非對(duì)功耗如 此敏感,但我認(rèn)為整體上還是會(huì)有影響的。
6、您會(huì)在很多其他領(lǐng)域譬如數(shù)字電視和有線通信,使用這種結(jié)構(gòu)?
Chris Rowen :當(dāng)然。那些可以為不同應(yīng)用優(yōu)化處理器的架構(gòu)是很重要的。而且我們也發(fā)現(xiàn),即使在一個(gè)新的水平,很多需求也是 相似的。因此同樣的Hi-Fi工具,同樣的音頻DSP,即可部署在世界最好的智能手機(jī)上,也同樣可以部署在最好的數(shù)字電視、藍(lán)光(Blue Ray)影碟機(jī)上。因?yàn)樗欠浅P《斓?。這方面的要求是相同的。
同樣,如果你看下Altas LTE的內(nèi)部架構(gòu),其主要構(gòu)造模塊BBE16或許是世界上最快的DSP核。而它同樣也在數(shù)字電視解調(diào)子系統(tǒng)中使用。同樣再一次因?yàn)樗目焖?、易編程,以?節(jié)約功耗。所以,我們可以看到在手機(jī)和客廳之間,在這兩個(gè)媒體處理器和基帶處理器之間,都有著共同的需求。
7、我看到您說,芯片的整合將集中在射頻、存儲(chǔ)和數(shù)字電路。那么您覺得它們?nèi)哌€有可能合并成一個(gè)嗎?
Chris Rowen :嗯。如果你從半導(dǎo)體工藝(Semiconductor Process)技術(shù)的角度來看,我認(rèn)為在晶體管和器件優(yōu)化的層面將會(huì)有些事情發(fā)生。因此在某些情況下,你可以作出權(quán)衡。特別是,我們正與很多客戶一起工 作,以簡化射頻電路。通過盡量多的數(shù)字處理器,你可以部分程度地脫離射頻和數(shù)字間的邊界。由于相比射頻而言,數(shù)字會(huì)有更加陡峭的生產(chǎn)成本曲線(Cost Production Curve),我們也就有更大的動(dòng)力去做。因此,我們會(huì)越來越依賴于數(shù)字方面的有效解決方案。
同樣的事情發(fā)生在存儲(chǔ)器。人們偶爾也會(huì)使它們結(jié)合在一起,但不是一個(gè)簡單的組合,內(nèi)存的加工設(shè)備(Fabrication Facility)與一般的優(yōu)化有所不同。所以我相信,多芯片封裝(Multi-Chip Packaging)將越來越重要。尤其當(dāng)你將芯片組(Die)一塊又一塊摞起來的時(shí)候。所以,你可以在數(shù)字芯片組上面摞存儲(chǔ)芯片組,然后上面再摞射頻芯 片組。這有可能在成本上是最劃算的。然后也可能有一種折衷的工藝技術(shù),把它們所有三個(gè)都放在一塊硅片上。這取決于你的應(yīng)用程序,比如需要一些存儲(chǔ)單元,又 或者需要一些射頻的單元。
但最終,我想我們還會(huì)堅(jiān)持三套不同的加工工藝,然后依靠封裝技術(shù)來整合在一起。不過這并不意味著,只要你能想辦法把它們?nèi)齻€(gè)捏一塊兒,你就得到一個(gè) 系統(tǒng)(System)了。因?yàn)檫€有物理屬性的要求,比如要多加塊電池什么的。但總的來說你要知道,物理尺寸是會(huì)越來越小了。
但你要知道還有個(gè)巨大的挑戰(zhàn),就是人們的手指不能變小,眼睛也不能變小。 (EEtrend:尤其是男生,哈哈!)對(duì),所以所謂得到“小尺寸”的設(shè)備,我們還是有實(shí)際限制的。我們?cè)谠骷用娴男?,其?shí)是對(duì)應(yīng)于我們自己可以接受 多小的屏幕和按鈕。所以說到最后,這事兒還是更和成本相關(guān)。
8、在書里您還預(yù)測了FPGA的未來。而幾天之前,Xilinx宣布嵌入ARM 的Cortex A9核。您覺得這是否是一種新趨勢?是否與Tensilica的 DPU形成競爭呢?
Chris Rowen :其實(shí)……并沒啥。我的意思是這種往處理器里一股腦嵌入FPGA的活兒,大概已經(jīng)折騰了快10年了。 Altera宣布他們與ARM互相嵌的時(shí)候,讓我想想啊,也是8年前了吧? (Larry:沒錯(cuò)?。?nbsp;
所以,這就跟任何一個(gè)系統(tǒng)想要找塊芯片,或者三塊芯片一塊兒呆著,沒啥區(qū)別。當(dāng)然,偶爾你也會(huì)碰巧搞出一塊啥都囊括了的數(shù)字芯片。話說回來,F(xiàn)PGA兄弟們有一個(gè)根本性的挑戰(zhàn),那就是FPGA的通用性非常高,可以做的事兒也賊多。但禍福相倚,要是讓它專注做一件事的話,也就不是那么有效率 了。所以,如果你想真正有效地利用處理器,我估計(jì)你情愿在處理器里隨便嵌一個(gè)稍微穩(wěn)定點(diǎn)的東西,而不是FPGA。
我認(rèn)為這是非常自然的一步。Xlinx以前也搭過Power PC,對(duì)吧?這其實(shí)是一碼事。它壓根沒有改變?nèi)魏卧械募軜?gòu),也沒有在CPU和FPGA的功能之間取得任何邏輯上的合并(Merge)。部分是因?yàn)樗麄儧] 有任何合并的工具軟件模式。
當(dāng)然,F(xiàn)PGA是很容易配置的,而且價(jià)格也便宜。因此,他們占據(jù)了一部分的市場,尤其是那些量低而開發(fā)成本又低的。因此,我們?cè)谑忻嫔峡吹酱罅康?FPGA設(shè)計(jì)。但是基于FPGA的設(shè)計(jì)總量是很小的。它其實(shí)是一個(gè)利基(Niche)市場。極端地說,即便有很多工程師在使用它,但幾乎所有都是低產(chǎn)量 的。
所以我的意思是,F(xiàn)PGA很重要,但不是Tensilica公司關(guān)注的。我們專注于高產(chǎn)量,并且?guī)椭切┰噲D在設(shè)計(jì)上節(jié)約幾納米硅片的兄弟 們。(EEtrend:完全兩個(gè)不同的群體咯?)是啊,他們離得是遠(yuǎn)了點(diǎn)兒。當(dāng)然他們偶爾也會(huì)重疊。譬如基站。以前有很多基站是采用Altera的儲(chǔ)存方 案的。挺重的。慢慢地我們看到越來越多因?yàn)槿萘?、成本和功耗的要求,從FPGA轉(zhuǎn)向了更加高集成度的芯片解決方案。
9、我在IEEE的設(shè)計(jì)與測試(Design & Test)上看到一篇您的談話。您說,如果我們想要進(jìn)入嵌入式系統(tǒng)設(shè)計(jì)的大規(guī)模并行領(lǐng)域,可配置的多核處理器SoC就有一些問題必須得到解決。幾年前,您 還提到過,Intel最大的問題是怎樣為通用計(jì)算應(yīng)用配置多核處理器。您現(xiàn)在還覺得多核處理器遭遇困境嗎?
Chris Rowen :這個(gè)……其實(shí)是分開的兩碼事。對(duì)于多核應(yīng)用層面而言,確實(shí)存在著重大考驗(yàn)。就是如何找到足夠多的線程 (Thread)來運(yùn)行。但它不是Intel單獨(dú)遇到的問題。這是一個(gè)涉及到應(yīng)用程序是如何被調(diào)用,以及在當(dāng)下如此小型的設(shè)備上如何架構(gòu)的問題。即便打開 我自己的筆記本電腦,當(dāng)我想看看到底有多少個(gè)線程準(zhǔn)備在跑,它基本上都是很少的。通常情況下,操作系統(tǒng)、用戶界面和應(yīng)用程序開發(fā)等等所調(diào)用的方式,都完全 沒有最大化利用線程的數(shù)量。
所以,我認(rèn)為你在基本的架構(gòu)層面可以做的,就是提供更多的線程運(yùn)行,并且充分地利用到并行。當(dāng)然在應(yīng)用層面也會(huì)有很多層級(jí)限制。你知道現(xiàn)在很方便就 去搞個(gè)四核八核十六核的,但是在PC這一端,相對(duì)于服務(wù)器,只有相對(duì)較少的條件可以讓我們找到這些線程。于是一大現(xiàn)象便是操作系統(tǒng)和應(yīng)用程序的逐步重組 (Restructuring)。
另一個(gè)同樣重要的現(xiàn)象是,確定哪些任務(wù)可以被放進(jìn)數(shù)據(jù)層(Data Plane)。讓我們來想想哪些東西通常是可以被放進(jìn)數(shù)據(jù)處理器的,譬如在無線信道這類的通訊子系統(tǒng),譬如存儲(chǔ)系統(tǒng),比如你怎么分發(fā)數(shù)據(jù),或者你知道的, 安全冗余,也可能是針對(duì)壓縮流(Packing Stream)的特殊網(wǎng)絡(luò)處理器,它可以是視頻也可以是音頻。這些東西其實(shí)是更本質(zhì)(Inherently)的并行處理。
所以吧,我覺得這里有兩種并行重組。其一是所謂的,去各地兒找更多的線程應(yīng)用。另一種是為了維持整體系統(tǒng)中卸載(Off Loading)并行部分的最大值,并讓之進(jìn)入數(shù)據(jù)層。實(shí)際上我認(rèn)為,在數(shù)據(jù)層提取并行是更容易操作的。因此,在數(shù)據(jù)層有效使用多核的數(shù)量,遠(yuǎn)大于單單在 應(yīng)用層面使用的多核。這也就是為啥我們認(rèn)為自己正走在康莊大道上。關(guān)注于數(shù)據(jù)層,可以使我們?cè)诙嗪朔矫娴某砷L速度大大超過那些只盯著應(yīng)用層面的兄弟。
10、所以在手機(jī)上就不是個(gè)問題咯?
Chris Rowen :恩可以這么說。這變得相當(dāng)容易,讓我們舉一個(gè)LTE基帶(Baseband)的例子吧。我們的Atlas平 臺(tái)可以弄出七或八核,取決于你想怎么用。DoCoMo和他的合作伙伴,NEC、富士通以及松下,已經(jīng)宣布并且詳細(xì)描述了他們LTE基帶架構(gòu)。第一代是8到 10核。另一個(gè)叫做Blue Wonder Communication的合作伙伴也推出了他們的8至10核的LTE基帶。因此,現(xiàn)在就有三種不同的LTE基帶,而這三種都使用了約8個(gè)核。在這個(gè)層 面上是可以有大量的并行解決方案的。
再看看下一代的LTE,大概有六點(diǎn)性能方面的因素需要考慮。其中一些是單核怎樣可以更快,但更大部分和多核有關(guān)。所以我們很容易找到那些有效應(yīng)用而 20核甚至更多核于單一功能譬如基帶的案例。和那些圍觀應(yīng)用處理器的哥們比起來,他們?nèi)绻杏X好,就整兩個(gè)核玩玩;如果還很爽,那就再整四個(gè)。我覺得在數(shù)據(jù)層和應(yīng)用層上,多核是有完全不同的機(jī)會(huì)的。(E:太清楚了?。?nbsp;
11、時(shí)間不早了,最后一個(gè)問題吧。您當(dāng)年在斯坦福參與奠基了RISC 架構(gòu),后來也曾是MIPS的共同創(chuàng)始人。那么,請(qǐng)問您如何看待RISC架構(gòu)的未來?依舊是ARM和MIPS之間的戰(zhàn)爭,抑或會(huì)發(fā)生一些新的大事件?
Chris Rowen :這個(gè)……在科學(xué)上,理想架構(gòu)已經(jīng)完全改變了。這場關(guān)于CISC和RISC架構(gòu)的爭論,其實(shí)就是通用 (General Purpose)架構(gòu)甲跟通用架構(gòu)乙之間的競爭罷了。RISC贏得了一職半銜,是因?yàn)樵谀硞€(gè)特定時(shí)期內(nèi)它手下有好幾十項(xiàng)半導(dǎo)體技術(shù)。但在這場戰(zhàn)爭中,摩爾 定律一下給出了這么多的晶體管,以至于你隨便搞個(gè)簡單的解碼或者流水線,都能奢侈地愛用多少就用多少。沒人管。所以一個(gè)RISC解碼器可能要一萬門,而 CISC解碼器需要五萬門。其實(shí)也差不多了多少。
不過我覺得除了通用架構(gòu)之間互掐以外,還有一場更加深遠(yuǎn)的革命。我們現(xiàn)在來比較通用架構(gòu)和一大家子的特殊用途(Special Purpose)架構(gòu),怎么樣?幾乎任何時(shí)候你都可以說,如果一個(gè)產(chǎn)品是圍繞某種特定的需求來設(shè)計(jì),那么特殊用途架構(gòu)鐵定勝出。 RISC扁了CISC一段時(shí)間,因?yàn)樗男矢叱?倍以上。那么為具體應(yīng)用特殊定制的架構(gòu),就比所有通用架構(gòu)都高效5至10倍以上了。
因此,這個(gè)世界不能再簡單分成我的通用架構(gòu),和你的通用架構(gòu)。當(dāng)然對(duì)于那些非常分散(Defused)并且普適(Generic)的應(yīng)用程序,就好 比在筆記本上用的那些,我們還是需要通用架構(gòu)的。因?yàn)橐粫?huì)兒你要看視頻,一會(huì)兒又要運(yùn)行Word或(E:打游戲),對(duì),或者Excel工作表。這是非常多 樣的。所以你需要一個(gè)德智體全面發(fā)展的處理器。不能太特別。
但總之,你不得不面對(duì)一個(gè)世界,那里有各種各樣不同的任務(wù),而每樣任務(wù)都是獨(dú)特的。而且更為重要的是,當(dāng)你因?yàn)槟柖啥谛酒霞傻钠舷到y(tǒng)越多,你越會(huì)發(fā)覺有足夠多的處理器適用于各種特定的應(yīng)用子系統(tǒng)。
因此對(duì)于我來說,計(jì)算的未來不是產(chǎn)生新的通用架構(gòu),而是特殊用途架構(gòu)的集合。譬如一個(gè)音頻子系統(tǒng)、視頻子系統(tǒng),一個(gè)基帶子系統(tǒng)、存儲(chǔ)子系統(tǒng),哦對(duì), 還有應(yīng)用處理器子系統(tǒng)。其中只有一個(gè)需要通用的結(jié)構(gòu)(Construction),其他里面都將是特殊的架構(gòu)。在科學(xué)上,摩爾定律帶來多核,多核又將帶來 特殊架構(gòu)的解決方案。異型多核(Heterogenic Multi-Core)就是一種新架構(gòu)。而且我覺得會(huì)成為主流。Intel、ARM、MIPS這些公司當(dāng)然還會(huì)有很大的市場,但只限于應(yīng)用處理器領(lǐng)域。其 實(shí)在科學(xué)上,通用目的(General Purpose)最終就會(huì)變成某一個(gè)特殊目的(Specific Purpose)。
(E:這真的很有趣。謝謝您?。?nbsp;
Chris Rowen :歡迎。你們的問題都蠻好玩的。
關(guān)于Tensilica公司
Tensilica是業(yè)界領(lǐng)先的且經(jīng)驗(yàn)證的可配置處理器IP供應(yīng)商。數(shù)據(jù)處理器結(jié)合了CPU和DSP的功能,針對(duì)不同應(yīng)用可以提高10到100倍的性能,Tensilica的自動(dòng)化處理器設(shè)計(jì)工具能夠針對(duì)應(yīng)用快速定制內(nèi)核,以滿足其特殊的數(shù)據(jù)處理性能需求。Tensilica可配置處理器為OEM制造商及世界前十大半導(dǎo)體廠商中的五家廣泛使用,這些產(chǎn)品包括移動(dòng)電話、消費(fèi)類電子設(shè)備(包括數(shù)字電視,藍(lán)光DVD,寬帶機(jī)頂盒,便攜式媒體播放器)、計(jì)算機(jī)、存儲(chǔ)、網(wǎng)絡(luò)和通訊芯片。更多關(guān)于Tensilica獲得專利的可配置處理器產(chǎn)品信息,請(qǐng)?jiān)L問公司網(wǎng)站:www.tensilica.com .
編者垂注:
Tensilica和Xtensa商標(biāo)所有權(quán)歸Tensilica, Inc所有,所有其它公司的產(chǎn)品,公司名稱和商標(biāo)歸各自公司所有。
Tensilica’s announced licensees include ADDMM, Afa Technologies, ALPS, Aquantia, Astute Networks, Atheros, AMD (ATI), Avision, Bay Microsystems, Berkeley Wireless Research Center, Brocade, Broadcom, Cisco Systems, CMC Microsystems, Conexant Systems, Design Art Networks, DS2, EE Solutions, Epson, ETRI, FUJIFILM Microdevices, Fujitsu Ltd., Fujitsu Microelectronics Ltd., Hudson Soft, iBiquity Digital, Ikanos Communications, Intel, Juniper Networks, LG Electronics, Lucid Information Technology, Marvell, NEC Laboratories America, NEC Corporation, NetEffect, Neterion, Nethra Imaging, Nippon Telephone and Telegraph (NTT), NuFront, NVIDIA, Olympus Optical Co. Ltd., Panasonic Mobile, Penstar, Plato Networks, PnpNetwork Technologies, PowerLayer Microsystems, SiBEAM, Silicon Optix, Sony, STMicroelectronics, Stretch, TranSwitch Corporation, Triductor Technology, u-Nav Microelectronics, UpZide, Valens Semiconductor, Validity Sensors, Victor Company of Japan (JVC), WiLinx, WiQuest Communications, and XM Radio.
晶體管相關(guān)文章:晶體管工作原理
晶體管相關(guān)文章:晶體管原理 攝像頭相關(guān)文章:攝像頭原理
評(píng)論