如何擴(kuò)展 FPGA 的工作溫度
如果超過最高溫度會發(fā)生什么情況?
本文引用地址:http://m.butianyuan.cn/article/201605/291733.htm隨著工作溫度升高,器件的使用壽命會下降,部件會老化得更快。某些老化過程,如電遷移和電腐蝕只會在較高溫度下發(fā)生。電遷移發(fā)生在有濕氣和電場存在的條件下。此時(shí)導(dǎo)體的原子
圖 3 - 環(huán)境溫度與結(jié)溫之間的關(guān)系。其中 Tj 代表結(jié)溫,Ta 代表環(huán)境溫度,Rth、package 代表結(jié)點(diǎn)與封裝外表面間的熱阻,Rth、ambient 代表封裝外表面和環(huán)境空氣間的熱阻
(如果沒有散熱器或空氣流時(shí)為 0)且 P 為器件耗散的功率。
會以離子形態(tài)從他們的初始位置移動(dòng),在另外的地方復(fù)位,留下一個(gè)空隙。這個(gè)空隙會減小該位置導(dǎo)體的有效寬度,造成該位置電場增強(qiáng),從而誘發(fā)更多的電遷移。這種鏈?zhǔn)椒磻?yīng)會在原子移走的位置
數(shù)字器件有三個(gè)功耗來源:動(dòng)態(tài)、靜態(tài)和焦耳效應(yīng)。
圖 4 - 熱吸收等式,其中Q 表示能夠吸收的最大熱量。
m 代表吸熱物質(zhì)的質(zhì)量,c 代表吸熱物質(zhì)的常數(shù),ΔT代表吸熱物質(zhì)在開始時(shí)的環(huán)境溫度和最終溫度之間的溫差。該公式僅適用于不可再生性吸熱材料和待吸收熱量為凈量的條件。這是條件不現(xiàn)實(shí),但這個(gè)公式已經(jīng)體現(xiàn)出壓力(質(zhì)量)、材料類型(c)和外部溫度在冷卻效率中所起到的作用。
中的代碼并測量了器件殼體的總功耗和溫度。有時(shí)如果峰值溫度較低,提高器件平均溫度也可接受。我們還在加速老化測試中評估了使用壽命。
我們的下一個(gè)設(shè)計(jì)選擇是為器件使用設(shè)定限制。為減少器件耗散的熱量,我們盡可能地避免使用邏輯單元和存儲器。器件未使用得到部分會
導(dǎo)致裂隙(開路)或在原子重定位的地方導(dǎo)致短路(樹突)。為數(shù)不多的幾層水分子足以引發(fā)金屬的離子化過程,觸發(fā)電遷移。這一現(xiàn)象會隨著溫度升高明顯嚴(yán)重化。
像鐵生銹這樣的腐蝕現(xiàn)象涉及濕氣和有害氣體。半導(dǎo)體材料封閉在其保護(hù)性封裝中。這種封裝一般對濕氣有高吸收性,但制作所用的材料不會輕易地產(chǎn)生腐蝕性離子溶液。這種腐蝕大多數(shù)情況下會給引線框和封裝接線造成不利影響。最重要的有害材料是硅鈍化層中所含的磷,以及半導(dǎo)體制造工藝或封裝工藝所殘留的部分污染物。在運(yùn)輸、焊接和裝配過程中接觸人體皮膚和其他化學(xué)品是導(dǎo)致污染的有害原子的其他可能來源。
當(dāng)異質(zhì)材料連接在一起時(shí),較便宜的材料相對于較貴的材料容易發(fā)生腐蝕(電化腐蝕)。這類型的腐蝕是隨時(shí)間推移性能降低的又一個(gè)原因。
在超過結(jié)溫溫度的情況下,無法保證器件的使用壽命,可能會大幅度縮短。如果溫度持續(xù)增長,該器件可能會立即失效。
器件的性能也取決于速度。器件在較高溫度下速度會下降,因此它們的最大時(shí)鐘速率會降低。
之所以把 Spartan-6 XA(汽車級)FPGA 的最高溫度限定為 125℃ 是出于最低使用壽命要求(可靠性考慮)和有保證的時(shí)鐘頻率能力(性能要求)。其他原因包 RAM 單元漏電和因這種漏電造成的位錯(cuò)誤。
多種解決方案
為克服我們的油井?dāng)z像頭設(shè)計(jì)的各類難題,我們實(shí)施了多種解決方案。
其中最重要的決定之一是選擇大小合適的器件。越大型的器件的靜態(tài)功耗越大,但有利于器件的散熱,避免形成熱點(diǎn)。經(jīng)認(rèn)證用于汽車用途的器件即使在高溫下也具有較長的使用壽命,因此對于使用壽命要求不高的工業(yè)應(yīng)用而言,更是一款合適的解決方案。我們已經(jīng)評估了 XA(車用)系列的 LX25 和 LX45 器件
消耗靜態(tài)功耗,但不會消耗動(dòng)態(tài)功耗。
我們還施加了時(shí)鐘門控。因?yàn)閯?dòng)態(tài)功耗取決于時(shí)鐘速率,我們可以使用時(shí)鐘門控抵消未被使用的模塊的動(dòng)態(tài)功耗。如果時(shí)鐘樹未觸發(fā),器件該部分的功耗就會降低。
我們還可以將我們使用的 I/O 數(shù)量保持在最低水平。這樣也可以降低 I/O 模塊的功耗。
因此,通過把部分 I/O 用作虛地,我們縮短了器件內(nèi)部電流的傳輸距離,從而降低了電源走線的焦耳效應(yīng)。虛地也有助于把熱量傳遞到地面。
因?yàn)槲覀儾幌胧褂盟械?nbsp;I/O 和所有的邏輯單元,我們選擇把這個(gè)設(shè)計(jì)分布到兩個(gè) FPGA 上(圖 5)。這樣就可以讓熱量在兩個(gè)單獨(dú)的位置耗散。
我們還使用多個(gè)接地面。這一技巧有助于把熱量從溫度較高的地方向溫度較低的地方傳遞,并提供額外的熱容量。為開發(fā)板的可靠性起見,在設(shè)計(jì)熱平面時(shí)應(yīng)考慮避免溫度周期過程中發(fā)生板層分離問題。
圖 5 - 為避免使用所有的 I/O 和邏輯單元(上方),該設(shè)計(jì)使用兩個(gè) Spartan-6 FPGA 而非一個(gè)。這意味著熱量可以在兩個(gè)單獨(dú)的地方耗散。
另一個(gè)重要步驟是優(yōu)化我們的代碼以降低時(shí)鐘速率。降低時(shí)鐘速率可以降低功耗,但也可以讓器件在更高的溫度下運(yùn)行。作為例子,我們評估了慢速并行設(shè)計(jì)和快速流水線化設(shè)計(jì)之間的權(quán)衡取舍。
為提升設(shè)計(jì)性能,我們確保在最終裝配前干燥各個(gè)組件并覆蓋一層能抵御濕氣的保護(hù)層。
在高溫下器件會老化得更快??梢允褂卯a(chǎn)品認(rèn)證來衡量設(shè)計(jì)的器件實(shí)際使用壽命隨溫度變化情況。
以恢復(fù)或至少檢測存儲器單元中或通信中的位錯(cuò)誤。如果狀態(tài)機(jī)以未使用的狀態(tài)結(jié)束,也可以恢復(fù)。
我們發(fā)現(xiàn)在開展我們的設(shè)計(jì)時(shí)使用賽靈思功耗估算器 (XPE) 是良好的開端。TVivado? Design Suite 為采用較新型的器件的設(shè)計(jì)提供功耗估算工具。不過測量真實(shí)器件上的功耗和比較不同版本的代碼經(jīng)證明是最理想、最準(zhǔn)確的做法。
我們也在生產(chǎn)中采用老化流程來預(yù)老化器件,移除那些老化速度看似比非熱電冷卻綜合運(yùn)用上述技巧,made simple.FPGA其他部件更快的部件(早期失效),從而只保留下最好的部件。
對我們的設(shè)計(jì)流程同樣重要的是使用循環(huán)冗余檢查 (CRC) 和其他類型的錯(cuò)誤檢測和糾正措施。我們在設(shè)計(jì)里的各個(gè)位置使用這些技巧,我們得到了一款能夠工作在 125℃ 環(huán)境溫度下且具備 SDRAM 管理、通信總線和圖像處理能力的攝像頭,雖然按規(guī)范其結(jié)溫不得超過 125℃。此外我們還努力做到了無需熱電冷卻也能在 125℃ 下正常運(yùn)行。
評論