利用FinFET優(yōu)勢的六種方式

作者：時間：2018-08-02 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

臺積電已經(jīng)發(fā)布了其重要的第四代16nm FinFET 工藝制程，16FFC(16nm FinFET Compact), 并進(jìn)入量產(chǎn)階段。為了能夠充分發(fā)揮好工藝制程的功耗，性能和面積(PPA)上的優(yōu)勢，必須要求我們的設(shè)計人員將有相關(guān)工藝知識的設(shè)計戰(zhàn)略和優(yōu)化的IP相結(jié)合，其中包括了標(biāo)準(zhǔn)元件庫和嵌入式存儲器。在這有六種方式去實現(xiàn)它。

本文引用地址：http://m.butianyuan.cn/article/201808/384954.htm

(1) 利用制程縮小的優(yōu)勢

16FFC 工藝制程擁有更小的晶體管間距(Poly 到Poly 間距)、更小的金屬線間距(線到線、VIA到線和VIA到VIA)用來走線和更小的存儲器單元，相比于臺積電28nm制程，16FFC 工藝已經(jīng)超越了摩爾定律對于面積和性能在工藝節(jié)點上的縮小。FinFET 制程同時也能產(chǎn)生更高的單位面積的飽和電流來促進(jìn)更小尺寸的邏輯單元達(dá)到更好的性能。IP設(shè)計人員可以利用這些縮小的工藝尺寸和改進(jìn)的晶體管性能去構(gòu)建更小/更快的邏輯單元和存儲器。SoC 模塊設(shè)計人員能夠利用這些優(yōu)勢去快速地收斂關(guān)鍵路勁上的時序，但是我們也必須意識到這些細(xì)小的，高阻抗的線所帶來的更高的線延遲還有復(fù)雜的信號電源網(wǎng)絡(luò)所產(chǎn)生的電遷移顧慮。

圖1所示，使用正確的IP，16FFC的設(shè)計可以超越摩爾定律的縮小規(guī)則，其面積可達(dá)到相同設(shè)計在28nm制程上的一半，而性能更快30%以上。

圖1：面積與性能– 28nm與16nm在CPU上的實現(xiàn)(來源：Synopsys)

(2) 柵極漏電的降低與動態(tài)功耗的增加之間的平衡

16FFC制程可以提供寬泛的閾值電壓(VT)和溝道長度的選擇來滿足于各種各樣對于性能和漏電流權(quán)衡的情況。圖2羅列了邏輯單元的性能相對于漏電流的分布(在對數(shù)尺度上)，以此來說明用相同的邏輯單元和不同的VT、溝道長度來實現(xiàn)性能和功耗的權(quán)衡。

圖2：相對性能與相對漏電流對應(yīng)每個VT和溝道長度， 7.5 track (T) 超高密度邏輯單元庫(來源：Synopsys)

很多移動和物聯(lián)網(wǎng)設(shè)備絕大部分的時間是處在待機(jī)或者休眠狀態(tài)，此時唯一的功耗就是漏電。FinFET的Ion/Ioff比值更高是由于其豎直的鰭式結(jié)構(gòu)。與傳統(tǒng)的平面型器件相比，F(xiàn)inFET還能在更低電壓下運行，來進(jìn)一步減少漏電。

總的功耗是動態(tài)功耗和靜態(tài)漏電之和。FinFET擁有更低的漏電流相比于平面型節(jié)點工藝，但是它也消耗更高的動態(tài)功耗，其原因在于Fin式結(jié)構(gòu)而增加的輸入電容和更高的飽和電流。

這種對于相對靜態(tài)漏電和動態(tài)功耗之間的變化要求我們也需要有不同于28nm的設(shè)計方案。圖3顯示了從180nm到16nm，漏電功耗占SoC總功耗的百分比。它表明了利用FinFET工藝設(shè)計的工作相對于平面型工藝來說，并不需要太多考慮漏電流的減少，而在于更多努力來控制動態(tài)功耗。

圖3：從180nm到16nm，漏電功耗占SoC總功耗的百分比(來源：Synopsys)

(3) 管理動態(tài)功耗

設(shè)計人員可以通過時鐘門翻轉(zhuǎn)頻率的管理，降低電容和最小化操作電壓來控制動態(tài)功耗。通過優(yōu)化的版圖和更短的走線來降低線電容。輸入電容的最小化可以通過利用給定的功能和頻率來選取最優(yōu)化高度的設(shè)計單元庫來實現(xiàn)。標(biāo)準(zhǔn)設(shè)計單元能夠被構(gòu)建在不同的高度下(整數(shù)倍的N、P fins)來滿足于不同模塊對于性能和可靠性的頻率要求。例如，圖4顯示了1X驅(qū)動能力的反相器在3個不同軌道高度上的輸入電容 (7.5T, 9T, 10.5T)

圖4：1X 驅(qū)動反相器的輸入電容(來源：Synopsys)

根據(jù)模塊的功能和頻率，如果用超高密度的7.5T設(shè)計單元庫來實現(xiàn)，在性能上相比于用高密度9T單元庫來說沒有那么好，但是由于器件電容的減少，功耗也會降低25%。

動態(tài)功耗同樣可以通過V^2這個系數(shù)用更低的操作電壓來降低，如圖5所示，模塊之間在不同操作電壓下的漏電功耗(虛線)和動態(tài)功耗(實線)。

圖5：多個標(biāo)準(zhǔn)電壓下性能與漏電和動態(tài)功耗的比較(來源：Synopsys)

(4) 優(yōu)化邏輯庫設(shè)計

充分利用臺積電16FFC制程的一個重要途徑是確保您使用的邏輯庫是經(jīng)過最大繞線密度的優(yōu)化。在這有多種方法可以去實線。

(4a) 減少面積和總功耗的高效版圖

充分利用先進(jìn)工藝的制程是至關(guān)重要的，比如利用在擴(kuò)散區(qū)邊緣可連續(xù)的多晶硅特性要比傳統(tǒng)的單晶硅更小5%的繞線面積。

(4b) 組合單元

優(yōu)化寄存器到寄存器路徑需要一套豐富的標(biāo)準(zhǔn)單元庫，其包含了各種特定功能，驅(qū)動能力和實現(xiàn)功能的單元。這些功能單元是綜合創(chuàng)建高效電路所必不可少的。優(yōu)化的版圖技術(shù)是要求充分利用最先進(jìn)的布線算法，最大化pin口的訪問和減少或者消除布局擁堵。先進(jìn)的綜合和布局布線工具能夠發(fā)揮出一套擁有豐富驅(qū)動能力選擇的單元庫的優(yōu)勢，來處理拓?fù)溥壿嬙O(shè)計和物理實際差距之間單元不同的的扇形輸出和負(fù)載。

(4c) 時序單元

人們有時將觸發(fā)器的設(shè)置和延遲時間稱為停滯時間。它會消耗掉每個時鐘周期里面處理實際計算工作的有效時間。

(5) 巧妙地運用不同的觸發(fā)器

我們可以通過運用多組高性能觸發(fā)器來減少停滯時間。延遲優(yōu)化的觸發(fā)器(多重延遲觸發(fā)器)能夠快速地向關(guān)鍵路徑邏輯集群發(fā)送信號。設(shè)置時序優(yōu)化的觸發(fā)器(多重設(shè)置時序觸發(fā)器)可作為捕獲寄存器，來延長多重增量中可用的時鐘周期。綜合布局布線優(yōu)化工具能夠被約束去使用這些多重設(shè)置和延遲觸發(fā)器來實現(xiàn)更多15-20%的性能提升。

(6) 存儲器編譯器設(shè)計

DesignWare 儲存器編譯器擁有先進(jìn)的功耗管理功能，能夠提供輕度睡眠模式，深度睡眠模式，斷電模糊和雙電源供電模式，以及讀寫輔助電路功能。同時還可以搭配DesignWare STAR Memory System ，來提供一套完整的嵌入式存儲器測試方案，完成從偵測到修復(fù)制造過程中的失效。

圖6：適用于各種應(yīng)用環(huán)境下的DesignWare Memory Compilers(來源：Synopsys)

總結(jié)

臺積電的16FFC工藝制程已經(jīng)改進(jìn)了面積的工藝設(shè)計規(guī)則，晶體管的性能和功耗比以及縮小了工藝偏差，使得我們可以用更小的設(shè)計規(guī)模來實現(xiàn)更高的性能，同時功耗也更低。為了能夠充分利用好先進(jìn)工藝的優(yōu)勢，設(shè)計者需要能夠獲取優(yōu)化的IP模塊，邏輯單元庫和存儲器編譯器，同時能運用好綜合布局布線工具來達(dá)到他們的最佳效果。

新聞中心

利用FinFET優(yōu)勢的六種方式

評論

相關(guān)推薦

技術(shù)專區(qū)