Linux進程的睡眠和喚醒

作者：時間：2023-12-26 來源：

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

Linux進程的睡眠和喚醒

在Linux中，僅等待CPU時間的進程稱為就緒進程，它們被放置在一個運行隊列中，一個就緒進程的狀態(tài)標志位為 TASK_RUNNING。一旦一個運行中的進程時間片用完， Linux 內(nèi)核的調(diào)度器會剝奪這個進程對CPU的控制權，并且從運行隊列中選擇一個合適的進程投入運行。

本文引用地址：http://m.butianyuan.cn/article/202312/454280.htm

當然，一個進程也可以主動釋放CPU的控制權。函數(shù) schedule() 是一個調(diào)度函數(shù)，它可以被一個進程主動調(diào)用，從而調(diào)度其它進程占用 CPU。一旦這個主動放棄 CPU 的進程被重新調(diào)度占用 CPU，那么它將從上次停止執(zhí)行的位置開始執(zhí)行，也就是說它將從調(diào)用 schedule() 的下一行代碼處開始執(zhí)行。

有時候，進程需要等待直到某個特定的事件發(fā)生，例如設備初始化完成、I/O 操作完成或定時器到時等。在這種情況下，進程則必須從運行隊列移出，加入到一個等待隊列中，這個時候進程就進入了睡眠狀態(tài)。

Linux 中的進程睡眠狀態(tài)有兩種：

· 一種是可中斷的睡眠狀態(tài)，其狀態(tài)標志位TASK_INTERRUPTIBLE。

· 另一種是不可中斷的睡眠狀態(tài)，其狀態(tài)標志位為TASK_UNINTERRUPTIBLE。

可中斷的睡眠狀態(tài)的進程會睡眠直到某個條件變?yōu)檎妫热缯f產(chǎn)生一個硬件中斷、釋放進程正在等待的系統(tǒng)資源或是傳遞一個信號都可以是喚醒進程的條件。不可中斷睡眠狀態(tài)與可中斷睡眠狀態(tài)類似，但是它有一個例外，那就是把信號傳遞到這種睡眠狀態(tài)的進程不能改變它的狀態(tài)，也就是說它不響應信號的喚醒。不可中斷睡眠狀態(tài)一般較少用到，但在一些特定情況下這種狀態(tài)還是很有用的，比如說：進程必須等待，不能被中斷，直到某個特定的事件發(fā)生。

在現(xiàn)代的 Linux 操作系統(tǒng)中，進程一般都是用調(diào)用 schedule() 的方法進入睡眠狀態(tài)的，下面的代碼演示了如何讓正在運行的進程進入睡眠狀態(tài)。

sleeping_task = current;
set_current_state(TASK_INTERRUPTIBLE);
schedule();
func1();
/* Rest of the code ... */

在第一個語句中，程序存儲了一份進程結構指針 sleeping_task，current 是一個宏，它指向正在執(zhí)行的進程結構。

set_current_state() 將該進程的狀態(tài)從執(zhí)行狀態(tài) TASK_RUNNING 變成睡眠狀態(tài) TASK_INTERRUPTIBLE。如果 schedule() 是被一個狀態(tài)為 TASK_RUNNING 的進程調(diào)度，那么 schedule() 將調(diào)度另外一個進程占用CPU。

如果 schedule() 是被一個狀態(tài)為 TASK_INTERRUPTIBLE 或 TASK_UNINTERRUPTIBLE 的進程調(diào)度，那么還有一個附加的步驟將被執(zhí)行：當前執(zhí)行的進程在另外一個進程被調(diào)度之前會被從運行隊列中移出，這將導致正在運行的那個進程進入睡眠，因為它已經(jīng)不在運行隊列中了。

我們可以使用下面的這個函數(shù)將剛才那個進入睡眠的進程喚醒。

wake_up_process(sleeping_task);

在調(diào)用了 wake_up_process() 以后，這個睡眠進程的狀態(tài)會被設置為 TASK_RUNNING，而且調(diào)度器會把它加入到運行隊列中去。當然，這個進程只有在下次被調(diào)度器調(diào)度到的時候才能真正地投入運行。

無效喚醒

幾乎在所有的情況下，進程都會在檢查了某些條件之后，發(fā)現(xiàn)條件不滿足才進入睡眠?？墒怯械臅r候進程卻會在判定條件為真后開始睡眠，如果這樣的話進程就會無限期地休眠下去，這就是所謂的無效喚醒問題。

在操作系統(tǒng)中，當多個進程都企圖對共享數(shù)據(jù)進行某種處理，而最后的結果又取決于進程運行的順序時，就會發(fā)生競爭條件，這是操作系統(tǒng)中一個典型的問題，無效喚醒恰恰就是由于競爭條件導致的。

設想有兩個進程A和B，A進程正在處理一個鏈表，它需要檢查這個鏈表是否為空，如果不空就對鏈表里面的數(shù)據(jù)進行一些操作，同時B進程也在往這個鏈表添加節(jié)點。當這個鏈表是空的時候，由于無數(shù)據(jù)可操作，這時A進程就進入睡眠，當B進程向鏈表里面添加了節(jié)點之后它就喚醒A進程，其代碼如下：

A進程:

1 spin_lock(&list_lock);
2 if (list_empty(&list_head)) {
3     spin_unlock(&list_lock);
4     set_current_state(TASK_INTERRUPTIBLE);
5     schedule();
6     spin_lock(&list_lock);
7 }
8
9 /* Rest of the code ... */
10 spin_unlock(&list_lock);

B進程:

100 spin_lock(&list_lock);
101 list_add_tail(&list_head, new_node);
102 spin_unlock(&list_lock);
103 wake_up_process(processa_task);

這里會出現(xiàn)一個問題，假如當A進程執(zhí)行到第3行后第4行前的時候，B進程被另外一個處理器調(diào)度投入運行。在這個時間片內(nèi)，B進程執(zhí)行完了它所有的指令，因此它試圖喚醒A進程，而此時的A進程還沒有進入睡眠，所以喚醒操作無效。

在這之后，A進程繼續(xù)執(zhí)行，它會錯誤地認為這個時候鏈表仍然是空的，于是將自己的狀態(tài)設置為 TASK_INTERRUPTIBLE 然后調(diào)用 schedule() 進入睡眠。由于錯過了B進程喚醒，它將會無限期的睡眠下去，這就是無效喚醒問題，因為即使鏈表中有數(shù)據(jù)需要處理，A進程也還是睡眠了。

避免無效喚醒

如何避免無效喚醒問題呢？

我們發(fā)現(xiàn)無效喚醒主要發(fā)生在檢查條件之后和進程狀態(tài)被設置為睡眠狀態(tài)之前，本來B進程的 wake_up_process() 提供了一次將A進程狀態(tài)置為 TASK_RUNNING 的機會，可惜這個時候A進程的狀態(tài)仍然是 TASK_RUNNING，所以 wake_up_process() 將A進程狀態(tài)從睡眠狀態(tài)轉變?yōu)檫\行狀態(tài)的努力沒有起到預期的作用。

要解決這個問題，必須使用一種保障機制使得判斷鏈表為空和設置進程狀態(tài)為睡眠狀態(tài)成為一個不可分割的步驟才行，也就是必須消除競爭條件產(chǎn)生的根源，這樣在這之后出現(xiàn)的 wake_up_process() 就可以起到喚醒狀態(tài)是睡眠狀態(tài)的進程的作用了。

找到了原因后，重新設計一下A進程的代碼結構，就可以避免上面例子中的無效喚醒問題了。

A進程:

1 set_current_state(TASK_INTERRUPTIBLE);
2 spin_lock(&list_lock);
3 if (list_empty(&list_head)) {
4     spin_unlock(&list_lock);
5     schedule();
6     spin_lock(&list_lock);
7 }
8 set_current_state(TASK_RUNNING);
9
10 /* Rest of the code ... */
11 spin_unlock(&list_lock);

可以看到，這段代碼在測試條件之前就將當前執(zhí)行進程狀態(tài)轉設置成 TASK_INTERRUPTIBLE 了，并且在鏈表不為空的情況下又將自己置為 TASK_RUNNING 狀態(tài)。

這樣一來如果B進程在A進程進程檢查了鏈表為空以后調(diào)用 wake_up_process()，那么A進程的狀態(tài)就會自動由原來 TASK_INTERRUPTIBLE 變成 TASK_RUNNING，此后即使進程又調(diào)用了 schedule()，由于它現(xiàn)在的狀態(tài)是 TASK_RUNNING，所以仍然不會被從運行隊列中移出，因而不會錯誤的進入睡眠，當然也就避免了無效喚醒問題。

Linux內(nèi)核的例子

在Linux操作系統(tǒng)中，內(nèi)核的穩(wěn)定性至關重要，為了避免在Linux操作系統(tǒng)內(nèi)核中出現(xiàn)無效喚醒問題，Linux內(nèi)核在需要進程睡眠的時候應該使用類似如下的操作：

/* q 是我們希望睡眠的等待隊列 */
DECLARE_WAITQUEUE(wait, current);
add_wait_queue(q, &wait);
set_current_state(TASK_INTERRUPTIBLE);
/* condition 是等待的條件 */
while (!condition) {
    schedule();
}
set_current_state(TASK_RUNNING);
remove_wait_queue(q, &wait);

上面的操作，使得進程通過下面的一系列步驟安全地將自己加入到一個等待隊列中進行睡眠：首先調(diào)用 DECLARE_WAITQUEUE() 創(chuàng)建一個等待隊列的項，然后調(diào)用 add_wait_queue() 把自己加入到等待隊列中，并且將進程的狀態(tài)設置為 TASK_INTERRUPTIBLE 或者 TASK_INTERRUPTIBLE。

然后循環(huán)檢查條件是否為真：如果是的話就沒有必要睡眠，如果條件不為真，就調(diào)用 schedule()。當進程檢查的條件滿足后，進程又將自己設置為 TASK_RUNNING 并調(diào)用 remove_wait_queue() 將自己移出等待隊列。

從上面可以看到，Linux的內(nèi)核代碼維護者也是在進程檢查條件之前就設置進程的狀態(tài)為睡眠狀態(tài)，然后才循環(huán)檢查條件。如果在進程開始睡眠之前條件就已經(jīng)達成了，那么循環(huán)會退出并用 set_current_state() 將自己的狀態(tài)設置為就緒，這樣同樣保證了進程不會存在錯誤的進入睡眠的傾向，當然也就不會導致出現(xiàn)無效喚醒問題。

下面讓我們用 Linux 內(nèi)核中的實例來看看其是如何避免無效睡眠的，這段代碼出自 Linux2.6 的內(nèi)核 (/kernel/sched.c):

/* Wait for kthread_stop */
set_current_state(TASK_INTERRUPTIBLE);
while (!kthread_should_stop()) {
    schedule();
    set_current_state(TASK_INTERRUPTIBLE);
}
__set_current_state(TASK_RUNNING);
return 0;

上面的這些代碼屬于遷移服務線程 migration_thread，這個線程不斷地檢查 kthread_should_stop()，直到 kthread_should_stop() 返回 1 它才可以退出循環(huán)，也就是說只要 kthread_should_stop() 返回 0 該進程就會一直睡眠。

從代碼中我們可以看出，檢查 kthread_should_stop() 確實是在進程的狀態(tài)被置為 TASK_INTERRUPTIBLE 后才開始執(zhí)行的。因此，如果在條件檢查之后但是在 schedule() 之前有其他進程試圖喚醒它，那么該進程的喚醒操作不會失效。

小結

通過上面的討論，可以發(fā)現(xiàn)在 Linux 中避免進程的無效喚醒的關鍵是在進程檢查條件之前就將進程的狀態(tài)置為 TASK_INTERRUPTIBLE 或 TASK_UNINTERRUPTIBLE，并且如果檢查的條件滿足的話就應該將其狀態(tài)重新設置為 TASK_RUNNING。

這樣無論進程等待的條件是否滿足，進程都不會因為被移出就緒隊列而錯誤地進入睡眠狀態(tài)，從而避免了無效喚醒問題。