軟件容錯方法之--軟件冗余
軟件容錯的主要目的是提供足夠的冗余信息和算法程序,使系統(tǒng)在實際運行時能夠及時發(fā)現(xiàn)程序設(shè)計錯誤,采取補救措施,以提高軟件可靠性,保證整個計算機系統(tǒng)的正常運行。
軟件容錯技術(shù)主要有恢復(fù)塊方法和N-版本程序設(shè)計,另外還有防衛(wèi)式程序設(shè)計等。
(1)恢復(fù)塊方法
故障的恢復(fù)策略一般有兩種:前向恢復(fù)和后向恢復(fù)。所謂前向恢復(fù)是指使當(dāng)前的計算繼續(xù)下去,把系統(tǒng)恢復(fù)成連貫的正確狀態(tài),彌補當(dāng)前狀態(tài)的不連貫情況,這需有錯誤的詳細(xì)說明。所謂后向恢復(fù)是指系統(tǒng)恢復(fù)到前一個正確狀態(tài),繼續(xù)執(zhí)行。這種方法顯然不適合實時處理場合。
1975年B.Randell提出了一種動態(tài)屏蔽技術(shù)棗恢復(fù)塊方法。恢復(fù)塊方法采用后向恢復(fù)策略。它提供具有相同功能的主塊和幾個后備塊,一個塊就是一個執(zhí)行完整的程序段,主塊首先投入運行,結(jié)束后進行驗收測試,如果沒有通過驗收測試,系統(tǒng)經(jīng)現(xiàn)場恢復(fù)后由一后備塊運行。這一過程可以重復(fù)到耗盡所有的后備塊,或者某個程序故障行為超出了預(yù)料,從而導(dǎo)致不可恢復(fù)的后果。設(shè)計時應(yīng)保證實現(xiàn)主塊和后備塊之間的獨立性,避免相關(guān)錯誤的產(chǎn)生,使主塊和后備塊之間的共性錯誤降到最低限度。驗收測試程序完成故障檢測功能,它本身的故障對恢復(fù)塊方法而言是共性,因此,必須保證它的正確性。
圖 恢復(fù)塊方法
(2)N-版本程序設(shè)計
1977年出現(xiàn)的N版本程序設(shè)計,是一種靜態(tài)的故障屏蔽技術(shù),采用前向恢復(fù)的策略,其設(shè)計思想是用N個具有相同功能的程序同時執(zhí)行一項計算,結(jié)果通過多數(shù)表決來選擇。其中N份程序必須由不同的人獨立設(shè)計,使用不同的方法,不同的設(shè)計語言,不同的開發(fā)環(huán)境和工具來實現(xiàn)。目的是減少N版本軟件在表決點上相關(guān)錯誤的概率。另外,由于各種不同版本并行執(zhí)行,有時甚至在不同的計算機中執(zhí)行,必須解決彼此之間的同步問題。
圖 N版本程序設(shè)計
(3)防衛(wèi)式程序設(shè)計
防衛(wèi)式程序設(shè)計是一種不采用任何一種傳統(tǒng)的容錯技術(shù)就能實現(xiàn)軟件容錯的方法,對于程序中存在的錯誤和不一致性,防衛(wèi)式程序設(shè)計的基本思想是通過在程序中包含錯誤檢查代碼和錯誤恢復(fù)代碼,使得一旦錯誤發(fā)生,程序能撤消錯誤狀態(tài),恢復(fù)到一個已知的正確狀態(tài)中去。其實現(xiàn)策略包括錯誤檢測,破壞估計和錯誤恢復(fù)三個方面。
除上述三種方法外,提高軟件容錯能力亦可以從計算機平臺環(huán)境、軟件工程和構(gòu)造異常處理模塊等不同方面達到。此外,利用高級程序設(shè)計語言本身的容錯能力,采取相應(yīng)的策略,也是可行的辦法。如c++語言中的try_except處理法:try_finally中止法等。
軟件容錯雖然起步較晚,但具有獨特的優(yōu)勢,費用增加較少。而硬件容錯的每一種策略都要增加費用。目前,軟件容錯已成為容錯領(lǐng)域重要分支之一。
51單片機相關(guān)文章:51單片機教程
c++相關(guān)文章:c++教程
評論