CPU溫控技術(shù)的分析及其對(duì)策
要 本文通過(guò)對(duì)CPU升溫原理的分析,列出當(dāng)前幾種主要的溫控技術(shù),并對(duì)它們的優(yōu)缺點(diǎn)進(jìn)行分析,同時(shí)探索了各種不同的抑制CPU升溫或者降溫的措施,最后給出對(duì)CPU各種不同降溫措施的評(píng)價(jià)。
本文引用地址:http://m.butianyuan.cn/article/202261.htm關(guān)鍵字 處理器;動(dòng)態(tài)功耗;溫度監(jiān)控
1 引言
隨著CPU集成度和運(yùn)行速度的不斷提高,其功耗也越來(lái)越大,導(dǎo)致CPU的運(yùn)行溫度越來(lái)越高,并成為CPU技術(shù)發(fā)展的瓶頸。CPU的溫升不僅影響CPU技術(shù)的進(jìn)一步快速發(fā)展,而且直接影響CPU的穩(wěn)定性和使用壽命。如何抑制CPU的溫升和迅速降低CPU的溫度成為CPU設(shè)計(jì)和使用的一個(gè)重點(diǎn)。CPU設(shè)計(jì)者主要從體系結(jié)構(gòu)設(shè)計(jì)、集成電路半導(dǎo)體材料選擇、CPU內(nèi)功能電路布局、CPU幾何尺寸等方面把握CPU的理論功耗和表面散熱途徑。CPU在完成設(shè)計(jì)并成為產(chǎn)品以后,在使用的過(guò)程中,它的實(shí)際功耗和散熱效率會(huì)因不同的使用環(huán)境而有所不同。CPU的使用環(huán)境包括周圍溫度、氣壓、通風(fēng)、供電電壓、時(shí)鐘頻率、散熱措施、負(fù)荷特點(diǎn)等。本文重點(diǎn)討論各種溫控技術(shù),并且給出解決降溫的各種措施。
2 影響CPU溫升的因素 CPU的溫升取決于兩大方面,一個(gè)方面是CPU工作不斷產(chǎn)生的熱量累積;另一個(gè)方面是對(duì)CPU產(chǎn)生的熱量的導(dǎo)散。熱量增加和散熱不暢都會(huì)導(dǎo)致CPU的溫度上升,并造成對(duì)CPU的損傷。CPU的熱量來(lái)源于它的功耗,根據(jù)CPU功耗與供電電壓和工作頻率的關(guān)系可以看到供電電壓和工作頻率是影響CPU溫升的兩個(gè)重要因素。 CMOS電路CPU的動(dòng)態(tài)功耗為P = CV2f,其中C表示電路負(fù)載大小,V表示供電電壓,f為工作頻率??梢?jiàn)工作頻率f與芯片的動(dòng)態(tài)功耗成線性正比例關(guān)系,供電電壓V的平方與芯片的動(dòng)態(tài)功耗成線性正比例關(guān)系,對(duì)于一顆CPU來(lái)說(shuō),電壓越高,時(shí)鐘頻率越快,則功率消耗越大。因此,在能夠滿足功能正常的前提下,盡可能選擇低電壓工作的CPU能夠在總體功耗方面得到較好的效果。對(duì)于已經(jīng)選定的CPU來(lái)講,降低供電電壓和工作頻率,也是一條節(jié)省功率的可行之路。
3 CPU的溫控技術(shù)[1][4][5]
3.1 外部溫度監(jiān)控技術(shù) 對(duì)CPU溫度監(jiān)控通過(guò)“外部監(jiān)測(cè)”措施—即通過(guò)主板CPU插座下面的熱敏電阻來(lái)監(jiān)測(cè)CPU工作時(shí)的溫度。CPU插座內(nèi)采用立式或貼片式的熱敏電阻。整個(gè)監(jiān)測(cè)過(guò)程全部是由主板來(lái)負(fù)責(zé),熱敏電阻直接將所監(jiān)測(cè)到的數(shù)據(jù)傳給主板上的溫控電路,如果監(jiān)測(cè)到CPU的工作溫度超過(guò)在BIOS中的預(yù)設(shè)值時(shí)就會(huì)自動(dòng)斷電關(guān)機(jī)或報(bào)警。采用此種方式的優(yōu)點(diǎn)是體積小、價(jià)格低,使用方便,不過(guò)在監(jiān)控處理器溫度時(shí)明顯存在缺陷,比如用此類監(jiān)測(cè)方式得到的溫度往往是CPU底面的溫度,而不是內(nèi)核溫度,溫度讀數(shù)是由監(jiān)控芯片根據(jù)溫敏電阻的阻值變化計(jì)算得出,而且此類接觸式測(cè)試受外部環(huán)境影響較大。如果熱敏電阻與微處理器接觸不夠緊密,微處理器的熱量不能有效地傳送到,所測(cè)量溫度會(huì)有很大誤差。有些主板上采用SMD貼片熱敏電阻去測(cè)量微處理器溫度,其測(cè)量誤差比直立式熱敏電阻誤差更大,因?yàn)檫@種貼片元件很難緊密接觸到微處理器。故此類CPU溫控結(jié)果誤差性極大、反應(yīng)不靈敏,所得結(jié)果僅僅只供參考。這就帶來(lái)了一個(gè)十分嚴(yán)重的問(wèn)題∶表面溫度不能及時(shí)反映微處理器核心溫度變化,從而形成一個(gè)時(shí)間滯后的問(wèn)題。因?yàn)楹诵臏囟茸兓笠?jīng)過(guò)一段時(shí)間才能傳送到微處理器表面。相比之下,表面溫度反應(yīng)十分遲鈍,其升溫速度遠(yuǎn)不及核心溫度,當(dāng)核心溫度發(fā)生急劇變化時(shí),表面溫度只有“小幅上揚(yáng)”。 Pentium 4和Athlon XP等最新的微處理器,其核心溫度變化速度達(dá)30~50℃/s,核心溫度的變化速度越快,測(cè)量溫度的延遲誤差也越大。在這種背景之下,如果再以表面溫度作為控制目標(biāo),保護(hù)電路尚未做出反應(yīng),微處理器可能早已燒壞。因此曾提出 “Temperature Offset Correction”(溫度偏差修正)的CPU內(nèi)核心溫度監(jiān)測(cè)溫度修正方案來(lái)糾正此種CPU溫控所帶來(lái)的偏差。所謂“溫度偏差修正”就是指當(dāng)系統(tǒng)采用外部測(cè)量法時(shí),必須在測(cè)量結(jié)果的基礎(chǔ)上增加一個(gè)溫度偏差值:即BIOS中顯示的溫度值=實(shí)際測(cè)試值 溫度偏差值。這個(gè)偏差值由主板熱敏電阻、臨界溫度等因素來(lái)決定,當(dāng)系統(tǒng)設(shè)定以后它就是一個(gè)常量(通過(guò)刷新BIOS可以改變這個(gè)值)。這些措施在一定程度上可以減小誤差值。但是,問(wèn)題仍不能得到根本性解決,比如對(duì)于突發(fā)事件(如風(fēng)扇脫落)所帶來(lái)的溫度急劇提升完全不能及時(shí)做出反應(yīng)。為此我們考慮采用內(nèi)部溫控技術(shù)。
3.2 內(nèi)部溫控技術(shù) 針對(duì)外部溫度監(jiān)控技術(shù)的不足, CPU廠商在CPU內(nèi)核里面加入了一個(gè)專門用于監(jiān)測(cè)CPU溫度的熱敏二極管,將CPU溫度來(lái)引了“內(nèi)部溫控”時(shí)代。在這里整個(gè)處理器溫度監(jiān)控系統(tǒng)可分為外部控制型和內(nèi)部控制型兩種基本結(jié)構(gòu)。外部控制型監(jiān)控系統(tǒng),其實(shí)就是主板的溫度監(jiān)控電路,它有三種基本存在形式∶一種是采用獨(dú)立的控制芯片,,這些芯片除了處理溫度信號(hào),同時(shí)還能處理電壓和轉(zhuǎn)速信號(hào);第二種形式是在BIOS芯片中集成了溫度控制功能;第三種形式是南橋芯片中集成溫度控制功能,目前新一代南橋芯片都有溫度監(jiān)控功能。而內(nèi)部控制型監(jiān)控系統(tǒng)則是指CPU內(nèi)核心中整合的熱敏二極管,這個(gè)熱敏二極管的正負(fù)兩極作為CPU兩個(gè)針腳直接來(lái)通過(guò)主板CPU插座和主板的溫度監(jiān)控電路相連。 在整個(gè)監(jiān)控過(guò)程中,當(dāng)CPU工作時(shí),熱敏二極管就將感應(yīng)到的數(shù)據(jù)變化傳輸給主板的溫控電路,由主板的一個(gè)特定邏輯運(yùn)算電路通過(guò)所接收到的數(shù)據(jù)計(jì)算出CPU的內(nèi)核溫度,如果計(jì)算出來(lái)的溫度高于預(yù)設(shè)溫度警戒線時(shí),系統(tǒng)就會(huì)自動(dòng)在瞬間切斷CPU核心電壓,使CPU停止工作并讓系統(tǒng)掛起來(lái),從而可以很好地保護(hù)CPU不被燒毀。P2、P3及Athlon XP處理器都是采用了此種技術(shù)。這種方法反饋回來(lái)的溫度并不是很準(zhǔn)確,往往要比CPU核心溫度低5度左右。為防止它的處理器過(guò)熱燒毀推出了S2K 總線斷開(kāi)技術(shù):即當(dāng)處理器內(nèi)核溫度過(guò)高時(shí),系統(tǒng)會(huì)發(fā)出一個(gè)HALT指令(HALT 改指令的意思是在沒(méi)有要處理的指令和數(shù)據(jù)時(shí)將處理器掛起),當(dāng)CPU接收到HALT指令時(shí),處理器會(huì)轉(zhuǎn)到相應(yīng)的等待模式,這種模式只需要消耗較小的功率。 通過(guò)在CPU內(nèi)核整合熱敏二極管來(lái)控溫已經(jīng)是一種能很準(zhǔn)確監(jiān)控CPU核心溫度的方法了,而且配合主板的溫控電路就能即時(shí)保護(hù)過(guò)熱的CPU,使其不至于在風(fēng)扇突然停轉(zhuǎn)或意外脫落時(shí)CPU被燒掉。但此類內(nèi)部溫控技術(shù)存在一個(gè)弊端,那就是在CPU溫度過(guò)高時(shí)通過(guò)直接關(guān)閉電腦來(lái)達(dá)到保護(hù)的目的,這樣會(huì)導(dǎo)致數(shù)據(jù)因?yàn)槲茨芗皶r(shí)保存而丟失,忽略了數(shù)據(jù)的價(jià)值往往要比一個(gè)CPU的價(jià)值要高的可能性。而且熱量不穩(wěn)定可能導(dǎo)致系統(tǒng)不穩(wěn)定,如果電腦死機(jī)或程序進(jìn)入死循環(huán),就會(huì)失去監(jiān)控作用,也就無(wú)法保護(hù)微處理器了。
3.3 熱量控制電路 為彌補(bǔ)第一代內(nèi)部溫度監(jiān)控技術(shù)的不足,Intel在Northwood核心P4中引入了第2代內(nèi)部溫度監(jiān)控技術(shù)—熱量控制電路(Thermal Control Circuit,英特爾又將它命名為熱量監(jiān)視器(Thermal Monitoring))。P3、Athlon XP的溫控電路的特點(diǎn)是內(nèi)部?jī)H擁有一個(gè)熱敏二極管不同,而Northwood核心P4的熱量控制電路擁有兩套熱敏二極管。其中一套熱敏二極管偵測(cè)CPU的溫度值并傳輸給主板上的硬件監(jiān)控系統(tǒng),這套裝置像傳統(tǒng)的內(nèi)部溫控技術(shù)一樣通過(guò)關(guān)閉系統(tǒng)來(lái)保護(hù)CPU,不過(guò)只是在緊急情況才會(huì)自動(dòng)關(guān)閉。第二套熱敏二極管放置在CPU內(nèi)核溫度最高的部位,幾乎觸及ALU單元,并作為熱量控制電路的一個(gè)組成部分。在CPU工作中,這兩套熱敏二極管的電阻會(huì)因溫度而變化,因此通過(guò)它的電流也會(huì)隨著CPU的核心溫度而變化,通過(guò)與內(nèi)設(shè)參考電流的比較,系統(tǒng)能夠判斷當(dāng)前電流是否達(dá)到了臨界點(diǎn)。如果CPU最熱的地方超過(guò)一定值,第二套熱量溫控裝置會(huì)發(fā)送一個(gè)PROCHOT#信號(hào)使熱量控制電路系統(tǒng)開(kāi)始工作,通過(guò)減小CPU的負(fù)載來(lái)降溫,其實(shí)這套熱敏二極管起到波動(dòng)調(diào)節(jié)作用。Pentium 4的熱量控制機(jī)制并非是減少時(shí)鐘頻率,而是減少其輸出的有效工作頻率。
更多計(jì)算機(jī)與外設(shè)信息請(qǐng)關(guān)注:21ic計(jì)算機(jī)與外設(shè)頻道
評(píng)論