利用FinFET優(yōu)勢的六種方式
臺積電已經發(fā)布了其重要的第四代16nm FinFET 工藝制程,16FFC(16nm FinFET Compact), 并進入量產階段。 為了能夠充分發(fā)揮好工藝制程的功耗,性能和面積(PPA)上的優(yōu)勢, 必須要求我們的設計人員將有相關工藝知識的設計戰(zhàn)略和優(yōu)化的IP相結合,其中包括了標準元件庫和嵌入式存儲器。在這有六種方式去實現(xiàn)它。
本文引用地址:http://m.butianyuan.cn/article/201808/384954.htm(1) 利用制程縮小的優(yōu)勢
16FFC 工藝制程擁有更小的晶體管間距(Poly 到Poly 間距)、更小的金屬線間距(線到線、VIA到線和VIA到VIA)用來走線和更小的存儲器單元, 相比于臺積電28nm制程,16FFC 工藝已經超越了摩爾定律對于面積和性能在工藝節(jié)點上的縮小。FinFET 制程同時也能產生更高的單位面積的飽和電流來促進更小尺寸的邏輯單元達到更好的性能。IP設計人員可以利用這些縮小的工藝尺寸和改進的晶體管性能去構建更小/更快的邏輯單元和存儲器。SoC 模塊設計人員能夠利用這些優(yōu)勢去快速地收斂關鍵路勁上的時序,但是我們也必須意識到這些細小的,高阻抗的線所帶來的更高的線延遲還有復雜的信號電源網絡所產生的電遷移顧慮。
圖1所示,使用正確的IP,16FFC的設計可以超越摩爾定律的縮小規(guī)則,其面積可達到相同設計在28nm制程上的一半,而性能更快30%以上。
(2) 柵極漏電的降低與動態(tài)功耗的增加之間的平衡
16FFC制程可以提供寬泛的閾值電壓(VT)和溝道長度的選擇來滿足于各種各樣對于性能和漏電流權衡的情況。圖2羅列了邏輯單元的性能相對于漏電流的分布(在對數(shù)尺度上),以此來說明用相同的邏輯單元和不同的VT、溝道長度來實現(xiàn)性能和功耗的權衡。
圖2: 相對性能與相對漏電流對應每個VT和溝道長度, 7.5 track (T) 超高密度邏輯單元庫(來源:Synopsys)
很多移動和物聯(lián)網設備絕大部分的時間是處在待機或者休眠狀態(tài),此時唯一的功耗就是漏電。FinFET的Ion/Ioff比值更高是由于其豎直的鰭式結構。與傳統(tǒng)的平面型器件相比,F(xiàn)inFET還能在更低電壓下運行,來進一步減少漏電。
總的功耗是動態(tài)功耗和靜態(tài)漏電之和。FinFET擁有更低的漏電流相比于平面型節(jié)點工藝,但是它也消耗更高的動態(tài)功耗,其原因在于Fin式結構而增加的輸入電容和更高的飽和電流。
這種對于相對靜態(tài)漏電和動態(tài)功耗之間的變化要求我們也需要有不同于28nm的設計方案。 圖3顯示了從180nm到16nm,漏電功耗占SoC總功耗的百分比。它表明了利用FinFET工藝設計的工作相對于平面型工藝來說,并不需要太多考慮漏電流的減少,而在于更多努力來控制動態(tài)功耗。
圖3:從180nm到16nm,漏電功耗占SoC總功耗的百分比(來源:Synopsys)
(3) 管理動態(tài)功耗
設計人員可以通過時鐘門翻轉頻率的管理,降低電容和最小化操作電壓來控制動態(tài)功耗。 通過優(yōu)化的版圖和更短的走線來降低線電容。輸入電容的最小化可以通過利用給定的功能和頻率來選取最優(yōu)化高度的設計單元庫來實現(xiàn)。標準設計單元能夠被構建在不同的高度下(整數(shù)倍的N、P fins)來滿足于不同模塊對于性能和可靠性的頻率要求。例如, 圖4顯示了1X驅動能力的反相器在3個不同軌道高度上的輸入電容 (7.5T, 9T, 10.5T)
圖4:1X 驅動反相器的輸入電容(來源:Synopsys)
根據模塊的功能和頻率,如果用超高密度的7.5T設計單元庫來實現(xiàn),在性能上相比于用高密度9T單元庫來說沒有那么好,但是由于器件電容的減少,功耗也會降低25%。
動態(tài)功耗同樣可以通過V^2這個系數(shù)用更低的操作電壓來降低,如圖5所示,模塊之間在不同操作電壓下的漏電功耗(虛線)和動態(tài)功耗(實線)。
圖5:多個標準電壓下性能與漏電和動態(tài)功耗的比較(來源:Synopsys)
(4) 優(yōu)化邏輯庫設計
充分利用臺積電16FFC制程的一個重要途徑是確保您使用的邏輯庫是經過最大繞線密度的優(yōu)化。在這有多種方法可以去實線。
(4a) 減少面積和總功耗的高效版圖
充分利用先進工藝的制程是至關重要的,比如利用在擴散區(qū)邊緣可連續(xù)的多晶硅特性要比傳統(tǒng)的單晶硅更小5%的繞線面積。
(4b) 組合單元
優(yōu)化寄存器到寄存器路徑需要一套豐富的標準單元庫,其包含了各種特定功能,驅動能力和實現(xiàn)功能的單元。這些功能單元是綜合創(chuàng)建高效電路所必不可少的。優(yōu)化的版圖技術是要求充分利用最先進的布線算法,最大化pin口的訪問和減少或者消除布局擁堵。先進的綜合和布局布線工具能夠發(fā)揮出一套擁有豐富驅動能力選擇的單元庫的優(yōu)勢,來處理拓撲邏輯設計和物理實際差距之間單元不同的的扇形輸出和負載。
(4c) 時序單元
人們有時將觸發(fā)器的設置和延遲時間稱為停滯時間。它會消耗掉每個時鐘周期里面處理實際計算工作的有效時間。
(5) 巧妙地運用不同的觸發(fā)器
我們可以通過運用多組高性能觸發(fā)器來減少停滯時間。 延遲優(yōu)化的觸發(fā)器(多重延遲觸發(fā)器)能夠快速地向關鍵路徑邏輯集群發(fā)送信號。設置時序優(yōu)化的觸發(fā)器(多重設置時序觸發(fā)器)可作為捕獲寄存器,來延長多重增量中可用的時鐘周期。綜合布局布線優(yōu)化工具能夠被約束去使用這些多重設置和延遲觸發(fā)器來實現(xiàn)更多15-20%的性能提升。
(6) 存儲器編譯器設計
DesignWare 儲存器編譯器擁有先進的功耗管理功能,能夠提供輕度睡眠模式,深度睡眠模式,斷電模糊和雙電源供電模式,以及讀寫輔助電路功能。同時還可以搭配DesignWare STAR Memory System ,來提供一套完整的嵌入式存儲器測試方案,完成從偵測到修復制造過程中的失效。
圖6:適用于各種應用環(huán)境下的DesignWare Memory Compilers(來源:Synopsys)
總結
臺積電的16FFC工藝制程已經改進了面積的工藝設計規(guī)則,晶體管的性能和功耗比以及縮小了工藝偏差,使得我們可以用更小的設計規(guī)模來實現(xiàn)更高的性能,同時功耗也更低。為了能夠充分利用好先進工藝的優(yōu)勢,設計者需要能夠獲取優(yōu)化的IP模塊,邏輯單元庫和存儲器編譯器,同時能運用好綜合布局布線工具來達到他們的最佳效果。
評論