嵌入式實時系統(tǒng)中的優(yōu)先級反轉(zhuǎn)問題
關(guān)鍵詞:嵌入式實時系統(tǒng) 多任務(wù) 信號量 優(yōu)先級反轉(zhuǎn)
1 問題的提出
目前,市場上占有率比較高的商業(yè)RTOS有VxWorks/PSOS、QNX、 LynxOS、VRTX,、Windows CE等。這些為數(shù)眾多的RTOS絕大多數(shù)都是多任務(wù)實時微內(nèi)核的結(jié)構(gòu),采用的是基于優(yōu)先級的可搶占式調(diào)度策略。系統(tǒng)為每一個任務(wù)分配一個優(yōu)先權(quán),調(diào)度程序保證當(dāng)前運行的進程是優(yōu)先權(quán)最高的進程。但是,有時候會出現(xiàn)一種比較奇怪的現(xiàn)象:由于多進程共享資源,具有最高優(yōu)先權(quán)的進程被低優(yōu)先級進程阻塞,反而使具有中優(yōu)先級的進程先于高優(yōu)先級的進程執(zhí)行,導(dǎo)致系統(tǒng)的崩潰。這就是所謂的優(yōu)先級反轉(zhuǎn)(Priority Inversion)。
2 優(yōu)先級反轉(zhuǎn)
RTOS普遍具有2個特點:實時性和多任務(wù)。實時是指系統(tǒng)的響應(yīng)時間必須在規(guī)定的時間內(nèi),超出這個時間限制將會使系統(tǒng)出現(xiàn)致命的錯誤;同時,實時性還要求對時間要求非常急迫的任務(wù)要先于對時間不是很緊急的任務(wù)執(zhí)行。正是由于這2個原因,RTOS的進程調(diào)度普遍采用的是基于優(yōu)先級的可搶占式PBP(Priority Based Preemptive)的調(diào)度策略。多任務(wù)是嵌入式系統(tǒng)的內(nèi)在要求。如今的嵌入式系統(tǒng)普遍要求具有多任務(wù)并發(fā)執(zhí)行的能力,因此RTOS中也必須提供多任務(wù)并發(fā)執(zhí)行的支持。由于多任務(wù)并發(fā),必然會導(dǎo)致多個任務(wù)共享資源。如有2個任務(wù)task1和task2并發(fā)執(zhí)行,都需要向打印機輸出結(jié)果。由于只有1臺打印機,所以在某個時間段內(nèi)只能有1個任務(wù),如task1占有打印機并向打印機輸出,而這時另一個任務(wù)task2處于等待狀態(tài)。當(dāng)task1輸出完畢后,task2由等待轉(zhuǎn)為就緒,當(dāng)RTOS再次調(diào)度它時,方可占有打印機向打印機輸出。試想如果不采取這種方式,不對打印機這種共享資源加以控制,而讓task1和task2同時向打印機輸出,這時候打印機打印的結(jié)果誰也看不懂,是一堆亂七八糟的東西。因此,大多數(shù)的RTOS采用了一種稱作信號量(semaphore)的機制來實現(xiàn)對共享資源的管理。任何一個想使用臨界資源(如打印機等共享資源)的進程在進入臨界區(qū)(如task1或task2中訪問臨界資源的代碼)之前必須擁有使用臨界資源的信號量,否則不可以執(zhí)行臨界區(qū)代碼。假設(shè)系統(tǒng)中有3個任務(wù),分別為task1、task2和task3。task1的優(yōu)先權(quán)高于task2,而task2的優(yōu)先權(quán)高于task3。恰在此時task1和task2 因某種原因被阻塞,這時候系統(tǒng)調(diào)度task3執(zhí)行。task3執(zhí)行一段時間后,task1被喚醒。由于采取的是PBP的調(diào)度策略,因此task1搶占task3的CPU, task1執(zhí)行。task1執(zhí)行一段時間后要進入臨界區(qū),但此時task3占有此臨界資源的信號量。因此task1被阻塞,處于等待狀態(tài),等待task3釋放此信號量。經(jīng)過這么一段時間后,task2此時此刻處于就緒狀態(tài)。因此系統(tǒng)調(diào)度task2執(zhí)行。如果task3在task2的執(zhí)行期間一直沒有能夠被調(diào)度執(zhí)行的話,那task1和task3將一直等到task2執(zhí)行完后才能執(zhí)行,task1更要等到task3釋放它所把持的信號量才能執(zhí)行;而這段時間完全有可能超出task1的Deadline,使得task1崩潰。當(dāng)系統(tǒng)看到有高優(yōu)先級的任務(wù)崩潰時候,系統(tǒng)認(rèn)為此時有重大事故發(fā)生,為了挽救系統(tǒng),看門狗電路起作用,系統(tǒng)可能被自動復(fù)位。從上面的分析可以看到,導(dǎo)致系統(tǒng)崩潰的原因是由于優(yōu)先級高的任務(wù)task1要獲取被低優(yōu)先級任務(wù)task2占有的臨界資源而被task2阻塞,而具有中優(yōu)先級的任務(wù)task2搶占task3的CPU,從而導(dǎo)致task2先于task1執(zhí)行。這時候系統(tǒng)便出現(xiàn)了優(yōu)先級反轉(zhuǎn)的情況,如圖1所示。
3 優(yōu)先級反轉(zhuǎn)的解決方法
目前解決優(yōu)先級反轉(zhuǎn)有許多種方法。其中普遍使用的有2種方法:一種被稱作優(yōu)先級繼承(priority inheritance);另一種被稱作優(yōu)先級極限(priority ceilings)。
在優(yōu)先級繼承方案中,當(dāng)高優(yōu)先級任務(wù)在等待低優(yōu)先級的任務(wù)占有的信號量時,讓低優(yōu)先級任務(wù)繼承高優(yōu)先級任務(wù)的優(yōu)先級,即把低優(yōu)先級任務(wù)的優(yōu)先權(quán)提高到高優(yōu)先級任務(wù)的優(yōu)先級;當(dāng)?shù)蛢?yōu)先級任務(wù)釋放高優(yōu)先級任務(wù)等待的信號量時,立即把其優(yōu)先權(quán)降低到原來的優(yōu)先權(quán)。采用這種方法可以有效地解決上面所述的優(yōu)先權(quán)反轉(zhuǎn)的問題。當(dāng)高優(yōu)先級任務(wù)task1想要進入臨界區(qū)時,由于低優(yōu)先級任務(wù)task3占有這個臨界資源的信號量,導(dǎo)致task1被阻塞。這時候,系統(tǒng)把task3的優(yōu)先權(quán)升到task1的優(yōu)先權(quán),此時優(yōu)先權(quán)處于task1和task3之間的任務(wù)task2,即使處于就緒狀態(tài)也不可以被調(diào)度執(zhí)行,因為此時task3的優(yōu)先權(quán)已經(jīng)高于task2,所以task3此時被調(diào)度執(zhí)行。當(dāng)task3釋放task1需要的信號量時,系統(tǒng)立即把task3的優(yōu)先權(quán)降到原來的高度,來保證task1和task2正常有序執(zhí)行。整個情況如圖2所示。目前,有許多RTOS是采用這種方法來防止優(yōu)先級反轉(zhuǎn)的,如大家比較熟悉的業(yè)界有名的WindRiver公司的VXWORKS。
在優(yōu)先權(quán)極限方案中,系統(tǒng)把每一個臨界資源與1個極限優(yōu)先權(quán)相聯(lián)系。這個極限優(yōu)先權(quán)等于系統(tǒng)此時最高優(yōu)先權(quán)加1。當(dāng)1個任務(wù)進入臨界區(qū)時,系統(tǒng)便把這個極限優(yōu)先權(quán)傳遞給這個任務(wù),使得這個任務(wù)的優(yōu)先權(quán)最高;當(dāng)這個任務(wù)退出臨界區(qū)后,系統(tǒng)立即把它的優(yōu)先權(quán)恢復(fù)正常,從而保證系統(tǒng)不會出現(xiàn)優(yōu)先權(quán)反轉(zhuǎn)的情況。如上例中,當(dāng)task3進入臨界區(qū)時,立即把它的優(yōu)先權(quán)升高到極限優(yōu)先權(quán),保證task3此時能盡快退出臨界區(qū),進而釋放其占有的信號量。當(dāng)高優(yōu)先級任務(wù)task1執(zhí)行的時候就不會出現(xiàn)其等待低優(yōu)先級任務(wù)task3釋放信號量而被阻塞的情況,從而保證不會出現(xiàn)上面所說的優(yōu)先級反轉(zhuǎn)。采用這種方案的另一個有利之處,是僅僅通過改變某個臨界資源的優(yōu)先級就可以使多個任務(wù)共享這個臨界資源,如下所示。
void TaskA(void){
...
SetTaskPriority(RES_X_PRIO);
// 訪問共享資源 X.
SetTaskPriority(TASK_A_PRIO);
...
}
以上就RTOS中優(yōu)先級反轉(zhuǎn)問題出現(xiàn)的原因以及解決方法進行了詳細的說明。21世紀(jì)將是嵌入式系統(tǒng)的時代。從事嵌入式系統(tǒng)設(shè)計的人員深入了解RTOS的原理和內(nèi)部潛在的問題,如優(yōu)先級反轉(zhuǎn)等,將有助于開發(fā)出更加可靠的產(chǎn)品。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評論