多任務(wù)系統(tǒng)看門狗的實現(xiàn)
該結(jié)構(gòu)體包括被監(jiān)視的任務(wù)號taskID,用來模擬“喂狗”的變量CurCnt、LastCnt(具體含義見下文),看門狗狀態(tài)標志RunState用來控制當(dāng)前任務(wù)是否接受監(jiān)視。
被監(jiān)視的任務(wù)Task1~Taskn調(diào)用自定義函數(shù)CreateWatchDog(int taskid)來創(chuàng)建看門狗,被監(jiān)視任務(wù)一段時間內(nèi)要求“喂狗”,調(diào)用ResetWatchDog(int taskid),這個“喂狗”動作實質(zhì)就是對看門狗定時器結(jié)構(gòu)體中的變量CurCnt加1操作。TaskMonitor大部分時間處于延時狀態(tài),假設(shè)硬件看門狗定時是2秒,監(jiān)視任務(wù)可以延時1.5秒,接著對創(chuàng)建的看門狗定時器組一一檢驗,延時前保存CurCnt的當(dāng)前值到LastCnt,延時后比較CurCnt與LastCnt是否相等,都不相等系統(tǒng)才是正常的。需要注意的是CurCnt和LastCnt數(shù)據(jù)字節(jié)數(shù)太小,而“喂狗”過于頻繁,可能出現(xiàn)CurCnt加1操作達到一個循環(huán)而與LastCnt相等。
如果有任意一組的CurCnt等于LastCnt,認為對應(yīng)接受監(jiān)視的任務(wù)沒有“喂狗”動作,也就檢測到該任務(wù)出現(xiàn)故障需要重啟,這時候TaskMonitor不對硬件看門狗定時器清零,或者延時很長的時間,比如10秒,足以使得系統(tǒng)重啟。反之,系統(tǒng)正常,Task1~Taskn定期對TaskMonitor“喂狗”,TaskMonitor又定期對硬件看門狗“喂狗”,系統(tǒng)就得不到復(fù)位。還有一點,被監(jiān)視任務(wù)可以通過調(diào)用PauseWatchDog(int taskid)來取消對應(yīng)的看門狗,實際上就是對STRUCT_WATCH_DOG結(jié)構(gòu)體中的RunState操作,該標志體現(xiàn)看門狗有效與否。
這種方式可監(jiān)視的最大任務(wù)數(shù)由STRUCT_WATCH_DOG結(jié)構(gòu)數(shù)據(jù)的個數(shù)決定。程序中應(yīng)該有一個變量記錄當(dāng)前已創(chuàng)建的看門狗數(shù),判斷被監(jiān)視任務(wù)Task1~Taskn是否“喂狗”只需比較CurCnt與LastCnt的值n次。
圖3:系統(tǒng)復(fù)位邏輯圖。
硬件看門狗監(jiān)視TaskMonitor任務(wù),TaskMonitor任務(wù)又監(jiān)視其他的被監(jiān)視任務(wù)Task1~Taskn,形成這樣一種鏈條。這種方式系統(tǒng)的故障圖表示如圖3所示。被監(jiān)視任務(wù)Task1~Taskn及TaskMonitor都是或的關(guān)系,因此被監(jiān)視的任一任務(wù)發(fā)生故障,硬件電路看門狗就能復(fù)位。
為實現(xiàn)多任務(wù)系統(tǒng)的看門狗監(jiān)視功能額外增加了TaskMonitor任務(wù),這個任務(wù)占用執(zhí)行時間多少也是一個重要問題。假設(shè)TaskMonitor任務(wù)一個監(jiān)視周期延時1.5秒,此外需要執(zhí)行保存當(dāng)前計數(shù)值,判斷是否“喂狗”等語句,它的CPU占用時間是很小的。用一個具體的試驗證實,使用50M工作頻率的CPU(S3C4510),移植vxWorks操作系統(tǒng),cache不使能條件下監(jiān)視10個任務(wù),每個監(jiān)視周期占用220~240微秒??梢娫撊蝿?wù)絕大多數(shù)時間都處于任務(wù)延時狀態(tài)。
被監(jiān)視任務(wù)可能有獲取消息、等待一個信號量等的語句,往往這個消息、信號量的等待是無限期的等待。這就需要將這類語句作一些修改。比
如在vxWorks中將一次無期限的獲取信號量操作
semTake(semID, WAIT_FOREVER); // WAIT_FOREVER為無限時間等待
分解為
do
{
ResetWatchDog; // “喂狗”操作
}while(semTake(semID, sysClkRateGet( )) != OK); // 1s內(nèi)的等待信號量操作
多次的時間范圍內(nèi)的獲取信號量操作,這樣才能保證及時“喂狗”。
另外需要注意的是系統(tǒng)中是否有的任務(wù)優(yōu)先級比TaskMonitor高并且長時間處于執(zhí)行狀態(tài),TaskMonitor長時間得不到調(diào)度,使得看門狗錯誤復(fù)位。良好的任務(wù)劃分,配置是不應(yīng)該出現(xiàn)這種高優(yōu)先級任務(wù)長期執(zhí)行狀況的。
評論