新聞中心

EEPW首頁(yè) > 電源與新能源 > 設(shè)計(jì)應(yīng)用 > 技術(shù)解析:?jiǎn)纹瑱C(jī)應(yīng)用系統(tǒng)的可靠性設(shè)計(jì)

技術(shù)解析:?jiǎn)纹瑱C(jī)應(yīng)用系統(tǒng)的可靠性設(shè)計(jì)

作者: 時(shí)間:2016-12-09 來(lái)源:網(wǎng)絡(luò) 收藏

隨著單片機(jī)在國(guó)防、金融、工業(yè)控制等重要領(lǐng)域應(yīng)用越來(lái)越廣泛,單片機(jī)應(yīng)用系統(tǒng)的可靠性越來(lái)越成為人們關(guān)注的一個(gè)重要課題。單片機(jī)應(yīng)用系統(tǒng)的可靠性是由多種因素決定的,大體分為硬件系統(tǒng)可靠性設(shè)計(jì)和軟件系統(tǒng)可靠性設(shè)計(jì)。

本文引用地址:http://m.butianyuan.cn/article/201612/328526.htm

一、硬件系統(tǒng)可靠性設(shè)計(jì)

(1)選優(yōu)設(shè)計(jì)

在系統(tǒng)硬件設(shè)計(jì)和加工時(shí),應(yīng)該選用質(zhì)量好的接插件,設(shè)計(jì)好工藝結(jié)構(gòu);選用合格的元器件,進(jìn)行嚴(yán)格的測(cè)試、篩選和老化;設(shè)計(jì)時(shí)技術(shù)參數(shù)(如負(fù)載)要留有一定的余量或降額使用元器件;提高印制板和組裝的質(zhì)量。

(2)冗余與容錯(cuò)設(shè)計(jì)

保證單片機(jī)應(yīng)用系統(tǒng)100%無(wú)故障是不可能的。容錯(cuò)是指當(dāng)系統(tǒng)的某個(gè)部件發(fā)生故障時(shí),系統(tǒng)仍能完全正常地工作,即給系統(tǒng)增加容忍故障的能力。為使系統(tǒng)具有容錯(cuò)能力,必須在系統(tǒng)中增加適當(dāng)?shù)娜哂鄦卧?,以保證當(dāng)某個(gè)部件發(fā)生故障時(shí)能由冗余部件接替其工作,原部件修復(fù)后再恢復(fù)出錯(cuò)前的狀態(tài)。硬件冗余設(shè)計(jì)可以在元件級(jí)、子系統(tǒng)或系統(tǒng)級(jí)上進(jìn)行。例如,在系統(tǒng)級(jí)上采用雙機(jī)系統(tǒng),兩套系統(tǒng)互為備用。

(3)采用硬件抗干擾措施

來(lái)自供電系統(tǒng)以及通過(guò)導(dǎo)線(xiàn)傳輸、電磁耦合等產(chǎn)生的電磁干擾信號(hào),是單片機(jī)系統(tǒng)工作不穩(wěn)定的重要因素,在系統(tǒng)硬件設(shè)計(jì)時(shí)必須采取有效的干擾抑制措施。單片機(jī)應(yīng)用系統(tǒng)中還常使用系統(tǒng)監(jiān)視電路檢測(cè)系統(tǒng)發(fā)生的錯(cuò)誤或故障,自動(dòng)報(bào)警或使系統(tǒng)自動(dòng)恢復(fù)正常工作狀態(tài)。如采用電源故障監(jiān)視、看門(mén)狗定時(shí)器等采用89C51單片機(jī)和X25045組成的看門(mén)狗電路,X25045硬件連接圖如圖所示。X25045芯片內(nèi)包含有一個(gè)看門(mén)狗定時(shí)器,可通過(guò)軟件預(yù)置系統(tǒng)的監(jiān)控時(shí)間。在看門(mén)狗定時(shí)器預(yù)置的時(shí)間內(nèi)若沒(méi)有總線(xiàn)活動(dòng),則X25045將從RESET輸出一個(gè)高電平信號(hào),經(jīng)過(guò)微分電路C2、R3輸出一個(gè)正脈沖,使CPU復(fù)位。如圖1所示電路中,CPU的復(fù)位信號(hào)共有3個(gè):上電復(fù)位(C1、R2),人工復(fù)位(S、R1、R2)和Watchdog復(fù)位(C2、R3),通過(guò)或門(mén)綜合后加到RESET端。C2、R3的時(shí)間常數(shù)不必太大,有數(shù)百微秒即可,因?yàn)檫@時(shí)CPU的振蕩器已經(jīng)在工作。


看門(mén)狗電路的定時(shí)時(shí)間長(zhǎng)短可由具體應(yīng)用程序的循環(huán)周期決定,通常比系統(tǒng)正常工作時(shí)最大循環(huán)周期的時(shí)間略長(zhǎng)即可。編程時(shí),可在軟件的合適地方加一條喂狗指令,使看門(mén)狗的定時(shí)時(shí)間永遠(yuǎn)達(dá)不到預(yù)置時(shí)間,系統(tǒng)就不會(huì)復(fù)位而正常工作。當(dāng)系統(tǒng)跑飛,用軟件陷阱等別的方法無(wú)法捕捉回程序時(shí),則看門(mén)狗定時(shí)時(shí)間很快增長(zhǎng)到預(yù)置時(shí)間,迫使系統(tǒng)復(fù)位。需要注意的是,在程序正常運(yùn)行的時(shí)候,應(yīng)該在適當(dāng)?shù)牡胤郊右粭l喂狗指令,使系統(tǒng)正常運(yùn)行時(shí)的定時(shí)時(shí)間達(dá)不到預(yù)置時(shí)間。系統(tǒng)就不會(huì)復(fù)位。二、軟件可靠性設(shè)計(jì)

單片機(jī)應(yīng)用系統(tǒng)的軟件和硬件是緊密相關(guān)的。要使整個(gè)系統(tǒng)具有較高的可靠性,除了在盡可能提高硬件可靠性的前提下,軟件的可靠性設(shè)計(jì)也是必不可少的,必須從設(shè)計(jì)、測(cè)試及長(zhǎng)期使用等方面來(lái)解決軟件可靠性。單片機(jī)系統(tǒng)的抗干擾能力是系統(tǒng)可靠性的重要指標(biāo)。由于51單片機(jī)的指令系統(tǒng)是復(fù)雜指令集結(jié)構(gòu),致使其抗干擾性能較低,尤其用在工業(yè)控制的場(chǎng)合,如果不增加額外的抗干擾措施,甚至無(wú)法正常工作。單片機(jī)軟件抗干擾設(shè)計(jì)的主要目的就是及時(shí)發(fā)現(xiàn)“跑飛”的程序,并及時(shí)地將程序拉入正常軌道,主要方法有:指令冗余、軟件“陷阱”、軟件“看門(mén)狗”等等。

(1)指令冗余

CPU取指令過(guò)程是先取操作碼,再取操作數(shù)。在程序的關(guān)鍵地方人為的插入一些單字節(jié)指令,或?qū)⒂行巫止?jié)指令重寫(xiě)稱(chēng)為指令冗余,通常是在雙字節(jié)指令和三字節(jié)指令后插入兩個(gè)字節(jié)以上的NOP指令。這樣即使跑飛程序飛到雙字節(jié)指令和三字節(jié)指令操作數(shù)上。由于窄操作指令NOP的存在,避免了后面的指令被錯(cuò)誤地執(zhí)行,為程序納入正軌做好準(zhǔn)備。此外,對(duì)系統(tǒng)流向起重要作用的指令,如RET、RETI、LCALI.、LJMP,JC等,可以在這些指令之后插入兩條NOP指令,可將跑飛程序納入正軌,以確保這些重要指令的執(zhí)行。指令冗余只能使CPU不再將操作數(shù)當(dāng)作操作碼錯(cuò)誤地執(zhí)行,卻不能主動(dòng)地將程序的錯(cuò)誤執(zhí)行方向扭轉(zhuǎn)過(guò)來(lái),要想糾止程序的錯(cuò)誤執(zhí)行方向,就需要下面的技術(shù)。

(2)設(shè)計(jì)軟件“陷阱”

通常在程序存儲(chǔ)器中未使用的EPROM空間填入窄操作指令NOP,最后再填入一條跳轉(zhuǎn)指令,跳轉(zhuǎn)到跑飛處理程序,或者直接填入指令LJMP 0000H,當(dāng)跑飛程序落到此區(qū)域。即可在執(zhí)行一段空操作后轉(zhuǎn)入正軌。如果未使用的EPROM空間比較大,可以均勻地填入幾條空操作指令和跳轉(zhuǎn)指令,這種幾條空操作指令加一條跳轉(zhuǎn)指令的結(jié)構(gòu)我們稱(chēng)之為“軟件陷阱”.

軟件陷阱的一般結(jié)構(gòu)為:

NOP

NOP

LJMP FLY

FLY為跑飛處理子程序,如果程序正常執(zhí)行,軟件陷阱部分是永遠(yuǎn)也執(zhí)行不到的,只有在程序跑飛到陷阱里,軟件陷阱會(huì)立刻將程序跳轉(zhuǎn)到正常軌道。即使程序沒(méi)有跑飛到陷阱里,也可以在程序執(zhí)行一段錯(cuò)誤操作后遇到一個(gè)軟件陷阱,從而轉(zhuǎn)入正軌。除了程序存儲(chǔ)器的空白區(qū)域,程序的數(shù)據(jù)表結(jié)尾也應(yīng)該設(shè)置軟件陷阱,如果數(shù)據(jù)表比較大,應(yīng)該在數(shù)據(jù)表的中間也設(shè)置軟件陷阱,以保證程序跑飛到數(shù)據(jù)區(qū)能及時(shí)轉(zhuǎn)入正軌。另外,如果程序存儲(chǔ)器的空間足夠大的話(huà),可以在每?jī)蓚€(gè)子程序中間設(shè) 置一個(gè)軟件陷阱。當(dāng)使用的中斷因干擾而開(kāi)放時(shí),在對(duì)應(yīng)的中斷服務(wù)程序中設(shè)置軟件陷阱,能及時(shí)捕獲錯(cuò)誤的中斷。軟件陷阱的數(shù)量要根據(jù)實(shí)際受到干擾的情況和程序存儲(chǔ)器的容量來(lái)確定,如果太少不能進(jìn)行有效的跑飛攔截,如果太多又會(huì)占用大量的程序存儲(chǔ)器空間。(3)軟件“看門(mén)狗”技術(shù)

跑飛的程序在執(zhí)行一些錯(cuò)誤操作之后。

經(jīng)常會(huì)進(jìn)入“死循環(huán)”,也就足常說(shuō)的“死機(jī)”.通常采用“軟件看門(mén)狗”技術(shù)使程序脫離“死循環(huán)”,軟件“看門(mén)狗”技術(shù)的原理是通過(guò)不斷檢測(cè)程序循環(huán)運(yùn)行時(shí)間,若發(fā)現(xiàn)程序循環(huán)時(shí)間超過(guò)最大循環(huán)運(yùn)行時(shí)間,則認(rèn)為系統(tǒng)陷入“死循環(huán)”,需要進(jìn)行出錯(cuò)處理。在實(shí)際應(yīng)用中,通常用定時(shí)中斷服務(wù)程序定時(shí)地檢查主程序的運(yùn)行情況。例如,在RAM區(qū)選擇一個(gè)字節(jié)作為軟件看門(mén)狗寄存器,主程序每循環(huán)一次將該寄存器加l,定時(shí)器TO的中斷服務(wù)程序每中斷一次將該寄存器減l并檢查一次,如果程序執(zhí)行正常??撮T(mén)狗寄存器不會(huì)改變或改變不大,如果看門(mén)狗寄存器發(fā)生了改變或改變很大,則說(shuō)明系統(tǒng)陷入“死循環(huán)”.需要進(jìn)行出錯(cuò)處理。在工業(yè)應(yīng)用中,嚴(yán)重的干擾有時(shí)會(huì)破壞中斷方式控制字,關(guān)閉中斷,造成看門(mén)狗失效,這時(shí)可以采用環(huán)形中斷監(jiān)視系統(tǒng)。用定時(shí)器TO監(jiān)視定時(shí)器Tl,用定時(shí)器Tl監(jiān)視豐程序,主程序監(jiān)視定時(shí)器T0.

采用這種環(huán)形結(jié)構(gòu)的軟件“看門(mén)狗”具有良好的抗干擾性能,大大提高了系統(tǒng)可靠性。對(duì)于需經(jīng)常使用Tl定時(shí)器進(jìn)行串口通訊的測(cè)控系統(tǒng),則定時(shí)器Tl不能進(jìn)行中斷,可改由串口中斷進(jìn)行監(jiān)控。當(dāng)然,對(duì)主程序最大循環(huán)周期、定時(shí)器T0和Tl定時(shí)周期應(yīng)于全盤(pán)合理考慮。軟件“看門(mén)狗”技術(shù)需要使用定時(shí)器,而在大多數(shù)的控制程序中,定時(shí)器都是緊俏的資源。這就使“軟件看門(mén)狗”技術(shù)的實(shí)際應(yīng)用受到了限制,我們可以采取一些技巧性的處理,將軟件“看門(mén)狗”程序與其它定時(shí)程序復(fù)用同一個(gè)定時(shí)器,這樣既完成定時(shí)功能又完成軟件“看門(mén)狗”的功能。

(4)檢查RAM區(qū)標(biāo)志數(shù)據(jù)及時(shí)發(fā)現(xiàn)嚴(yán)重干擾

這種方法是在RAM區(qū)中選擇幾個(gè)固定單元,在初始化程序中將其設(shè)置成固定的數(shù)據(jù),只要程序正常運(yùn)行,這些單元的內(nèi)容是不會(huì)改變的。如果因?yàn)槌绦颉芭茱w”或其它干擾導(dǎo)致這些RAM單元中的任何單元的數(shù)據(jù)發(fā)生了變化,說(shuō)明單片機(jī)系統(tǒng)已經(jīng)受到了嚴(yán)重的干擾,不能可靠地運(yùn)行下去了。我們可以在程序執(zhí)行的過(guò)程中適時(shí)地檢查這些RAM單元的內(nèi)容,一旦發(fā)現(xiàn)有數(shù)據(jù)改變,立刻執(zhí)行LJMP 0000 H語(yǔ)句,強(qiáng)制單片機(jī)復(fù)位。

(5)刷新輸出端口

排除嚴(yán)重干擾,當(dāng)單片機(jī)系統(tǒng)受到嚴(yán)重干擾時(shí),輸出端口的狀態(tài)也可能因干擾而改變,在程序的執(zhí)行過(guò)程中適時(shí)地根據(jù)相關(guān)程序模塊的運(yùn)算結(jié)果刷新輸出端口,可以排除干擾對(duì)輸出端口狀態(tài)的影響,使錯(cuò)誤的輸出狀態(tài)及時(shí)得到糾正。

(6)進(jìn)行多次輸入采樣

避免嚴(yán)重干擾,強(qiáng)烈的干擾會(huì)影響單片機(jī)的輸入信號(hào),造成輸入信號(hào)瞬間采樣的誤差或誤讀,要避免干擾的影響,通常采取重復(fù)采樣,加權(quán)平均的方法。

三、結(jié)束語(yǔ)

單片機(jī)系統(tǒng)運(yùn)行的可靠性會(huì)不確定因素的干擾。提高單片機(jī)應(yīng)用系統(tǒng)的可靠性要從軟硬件入手。提高系統(tǒng)的自身防御行為,以上所提到幾種提高可靠性的方法,都不是單獨(dú)使用的,只有根據(jù)實(shí)際情況將這些方法有效地結(jié)合起來(lái),才能達(dá)到最佳抗干擾效果,使我們的單片機(jī)系統(tǒng)穩(wěn)定可靠地工作。



評(píng)論


技術(shù)專(zhuān)區(qū)

關(guān)閉