基于TalusVortexFX的32/28納米節(jié)點(diǎn)設(shè)計(jì)方案
如worst-case和best-casePVT等特定系列條件就是我們俗稱的“角點(diǎn)”。在32/28納米技術(shù)節(jié)點(diǎn),晶粒間與晶粒內(nèi)PVT差異十分明顯,解決大量模式和角點(diǎn)的工作是必不可少的。而且,前文提過(guò)的低功耗設(shè)計(jì)技術(shù)還會(huì)讓這一問(wèn)題進(jìn)一步復(fù)雜化。例如:在多電源多電壓(MSMV)技術(shù)情況下,可能一個(gè)電壓島的電壓值為其允許電壓范圍內(nèi)最低電壓,另一個(gè)電壓島的電壓值為其允許電壓范圍內(nèi)最高電壓,而其余電壓島的電壓值則會(huì)在這兩者之間。又如:有的芯片具有不同操作模式、擁有的一個(gè)或多個(gè)電路模塊位于在電源切斷的晶粒中心都將導(dǎo)致所需分析的角點(diǎn)情況顯著增加。
目前工具的問(wèn)題在于:實(shí)現(xiàn)期間,芯片必須可在MMMC前景下進(jìn)行優(yōu)化。許多現(xiàn)有系統(tǒng)通過(guò)先考量已假設(shè)的worst-case情景、然后對(duì)別的條件進(jìn)行優(yōu)化的方式來(lái)著手處理優(yōu)化問(wèn)題。遺憾的是,這可能導(dǎo)致過(guò)度悲觀主義,造成次優(yōu)性能。甚至更糟的是,如果這些關(guān)于哪些是worst-case情景的假設(shè)是錯(cuò)誤的,那么結(jié)果可能是得到完全不管用的芯片。Talus1.2內(nèi)置有自帶MMMC處理功能,這意味著優(yōu)化過(guò)程不會(huì)漏掉任何情景。此外,Talus1.2的高速度和大容量還意味著,它能夠考慮到的不只是較小子集的實(shí)現(xiàn)情景,而是這款工具需要處理的整個(gè)系列的簽核情景。因此,Talus1.2可提供更好的性能和更短的實(shí)現(xiàn)周期。
以DistributedSmartSync技術(shù)增強(qiáng)TalusVortex的性能
前文所提及的物理實(shí)現(xiàn)流程每個(gè)步驟都是屬于計(jì)算密集型問(wèn)題。而且為了解決伴隨技術(shù)節(jié)點(diǎn)而增加的復(fù)雜性,每個(gè)節(jié)點(diǎn)必須執(zhí)行的計(jì)算量也在提高。此外,當(dāng)器件中所集成的功能越來(lái)越多時(shí),設(shè)計(jì)的規(guī)模和復(fù)雜性會(huì)隨著每個(gè)節(jié)點(diǎn)而提高,物理實(shí)現(xiàn)相關(guān)的計(jì)算需求也會(huì)相應(yīng)增加。
再有一個(gè)因素就是:功能模塊的尺寸(為實(shí)現(xiàn)模塊功能所需的單元數(shù)量)也會(huì)隨著每項(xiàng)功能中包裝進(jìn)越來(lái)越多特性而不斷增加。一些物理實(shí)現(xiàn)團(tuán)隊(duì)偏愛(ài)層次化方案,而另外一些團(tuán)隊(duì)則更喜歡使用“扁平化”方案,因?yàn)樗麄兏杏X(jué)在使用層次化方案時(shí)放棄了太多東西。
如果工具具有處理更大型電路模塊的能力,那么生產(chǎn)率就可得到即時(shí)的提升。例如:定義和微調(diào)層次化模塊間約束是極為耗時(shí)的資源密集型工作。如果這些工具具有處理更大型電路模塊的能力,那么就不需要定義子模塊間約束,因?yàn)椴粫?huì)有任何子模塊存在。這會(huì)大大提高生產(chǎn)率。
問(wèn)題在于:多數(shù)布局布線解決方案都局限于只能處理幾百萬(wàn)個(gè)單元。這常迫使物理實(shí)現(xiàn)工程師由于工具的局限性而不得不人工將電路模塊進(jìn)行分割。而這也對(duì)工程師生產(chǎn)率造成了影響。
除非通過(guò)某些方式進(jìn)行增強(qiáng),不然的話即便目前最先進(jìn)的Talus1.2布局布線解決方案的實(shí)際容量也只在200萬(wàn)到500萬(wàn)個(gè)單元之間,所提供的生產(chǎn)率為每天100-150萬(wàn)單元。結(jié)果會(huì)造成一種由容量驅(qū)動(dòng)的生產(chǎn)率差距。為了處理32/28納米節(jié)點(diǎn)設(shè)計(jì),實(shí)現(xiàn)包括1000萬(wàn)以上個(gè)單元的扁平電路模塊是必不可少的,如圖7所示(另見(jiàn)側(cè)邊欄)。
圖7.物理實(shí)現(xiàn)工具對(duì)扁平容量需求永不滿足。
在過(guò)去,一直是通過(guò)提供多線程功能來(lái)增強(qiáng)物理實(shí)現(xiàn)工具的容量和性能。在有些情況下,這些功能是被“生搬硬套”到的傳統(tǒng)工具上,效果有限。相較之下,Talus1.2中所有工具均完全內(nèi)置有自帶的多線程功能。
前文已說(shuō)過(guò),多線程對(duì)工具的作用十分有限;基于阿姆達(dá)爾定律(Amdahl’slaw)等計(jì)算機(jī)科學(xué)定律,(伴隨在其核心運(yùn)行的每個(gè)線程)線程的數(shù)量越來(lái)越多所起到的效果卻越來(lái)越小。簡(jiǎn)單來(lái)說(shuō),就是告訴我們,任何程序的加速均會(huì)受到并行數(shù)量的限制(也就是說(shuō),程序的最長(zhǎng)序列片斷關(guān)系到程序的其它部分),如圖8所示。
圖8.阿姆達(dá)爾定律反映了多線程的局限性。
對(duì)于被用來(lái)創(chuàng)建ASIC/ASSP/SoC器件的物理實(shí)現(xiàn)工具來(lái)說(shuō),這些工具的并行部分約占到了50%到75%。就如我們從圖8中所看到的“甜蜜點(diǎn)(sweetspot)”,而在best-case情景下,使用8-10個(gè)處理核心,只可獲得約3倍的加速。
幸運(yùn)的是,通過(guò)將物理實(shí)現(xiàn)任務(wù)分發(fā)到多臺(tái)機(jī)器上就可以克服阿姆達(dá)爾定律所定義的局限性。如圖9所示,采用全新DistributedSmartSync(分布式智能同步)技術(shù)的TalusVortexFX提供了與貫穿物理實(shí)現(xiàn)流程所有步驟(時(shí)鐘樹(shù)綜合除外,這種方法對(duì)它起不了什么作用)的智能同步技術(shù)相結(jié)合的獨(dú)特分布式管理。微捷碼將這款最新解決方案稱為TalusVortexFX,它以DistributedSmartSync技術(shù)增強(qiáng)了Talus1.2。
技術(shù)增強(qiáng)的TalusVortexFX流程的高級(jí)視圖
評(píng)論