Linux內核結構詳解
nbsp1.進程調度(SCHED):控制進程對CPU的訪問。當需要選擇下一個進程運行時,由調度程序選擇最值得運行的進程??蛇\行進程實際上是僅等待CPU資源的進程,如果某個進程在等待其它資源,則該進程是不可運行進程。Linux使用了比較簡單的基于優(yōu)先級的進程調度算法選擇新的進程。
nbsp2.內存管理(MM)允許多個進程安全的共享主內存區(qū)域。Linux的內存管理支持虛擬內存,即在計算機中運行的程序,其代碼,數據,堆棧的總量可以超過實際內存的大小,操作系統(tǒng)只是把當前使用的程序塊保留在內存中,其余的程序塊則保留在磁盤中。必要時,操作系統(tǒng)負責在磁盤和內存間交換程序塊。內存管理從邏輯上分為硬件無關部分和硬件有關部分。硬件無關部分提供了進程的映射和邏輯內存的對換;硬件相關的部分為內存管理硬件提供了虛擬接口。
nbsp3.虛擬文件系統(tǒng)(VirtualFileSystem,VFS)隱藏了各種硬件的具體細節(jié),為所有的設備提供了統(tǒng)一的接口,VFS提供了多達數十種不同的文件系統(tǒng)。虛擬文件系統(tǒng)可以分為邏輯文件系統(tǒng)和設備驅動程序。邏輯文件系統(tǒng)指Linux所支持的文件系統(tǒng),如ext2,fat等,設備驅動程序指為每一種硬件控制器所編寫的設備驅動程序模塊。
nbsp4.網絡接口(NET)提供了對各種網絡標準的存取和各種網絡硬件的支持。網絡接口可分為網絡協議和網絡驅動程序。網絡協議部分負責實現每一種可能的網絡傳輸協議。網絡設備驅動程序負責與硬件設備通訊,每一種可能的硬件設備都有相應的設備驅動程序。
nbsp5.進程間通訊(IPC) 支持進程間各種通信機制。
處于中心位置的進程調度,所有其它的子系統(tǒng)都依賴它,因為每個子系統(tǒng)都需要掛起或恢復進程。一般情況下,當一個進程等待硬件操作完成時,它被掛起;當操作真正完成時,進程被恢復執(zhí)行。例如,當一個進程通過網絡發(fā)送一條消息時,網絡接口需要掛起發(fā)送進程,直到硬件成功地完成消息的發(fā)送,當消息被成功的發(fā)送出去以后,網絡接口給進程返回一個代碼,表示操作的成功或失敗。其他子系統(tǒng)以相似的理由依賴于進程調度。
各個子系統(tǒng)之間的依賴關系如下:
進程調度與內存管理之間的關系:這兩個子系統(tǒng)互相依賴。在多道程序環(huán)境下,程序要運行必須為之創(chuàng)建進程,而創(chuàng)建進程的第一件事情,就是將程序和數據裝入內存。
進程間通信與內存管理的關系:進程間通信子系統(tǒng)要依賴內存管理支持共享內存通信機制,這種機制允許兩個進程除了擁有自己的私有空間,還可以存取共同的內存區(qū)域。
虛擬文件系統(tǒng)與網絡接口之間的關系:虛擬文件系統(tǒng)利用網絡接口支持網絡文件系統(tǒng)(NFS),也利用內存管理支持RAMDISK設備。
內存管理與虛擬文件系統(tǒng)之間的關系:內存管理利用虛擬文件系統(tǒng)支持交換,交換進程(swapd)定期由調度程序調度,這也是內存管理依賴于進程調度的唯一原因。當一個進程存取的內存映射被換出時,內存管理向文件系統(tǒng)發(fā)出請求,同時,掛起當前正在運行的進程。
除了這些依賴關系外,內核中的所有子系統(tǒng)還要依賴于一些共同的資源。這些資源包括所有子系統(tǒng)都用到的過程。例如:分配和釋放內存空間的過程,打印警告或錯誤信息的過程,還有系統(tǒng)的調試例程等等。
系統(tǒng)數據結構
在linux的內核的實現中,有一些數據結構使用頻度較高,他們是:
nbsptask_struct.
nbspLinux內核利用一個數據結構(task_struct)代表一個進程,代表進程的數據結構指針形成了一個task數組(Linux中,任務和進程是相同的術語),這種指針數組有時也稱為指針向量。這個數組的大小由NR_TASKS(默認為512),表明Linux系統(tǒng)中最多能同時運行的進程數目。當建立新進程的時候,Linux為新進程分配一個task_struct結構,然后將指針保存在task數組中。調度程序一直維護著一個current指針,他指向當前正在運行的進程。
nbspMm_struct
每個進程的虛擬內存由一個mm_struct結構來代表,該結構實際上包含了當前執(zhí)行映像的有關信息,并且包含了一組指向vm_area_struct結構的指針,vm_area_struct結構描述了虛擬內存的一個區(qū)域。
nbspInode
虛擬文件系統(tǒng)(VFS)中的文件、目錄等均由對應的索引節(jié)點(inode)代表。每個VFS索引節(jié)點中的內容由文件系統(tǒng)專屬的例程提供。VFS索引節(jié)點只存在于內核內存中,實際保存于VFS的索引節(jié)點高速緩存中。如果兩個進程用相同的進程打開,則可以共享inade的數據結構,這種共享是通過兩個進程中數據塊指向相同的inode完成。
Linux的具體結構
所謂具體結構是指系統(tǒng)實現的結構。
nbspLinux的具體結構類似于抽象結構,這種對應性是因為抽象結構來源于具體結構,我們的劃分沒有嚴格依照源代碼的目錄結構,且和子系統(tǒng)的分組也不完全匹配,但是,它很接近源代碼的目錄結構。
盡管前面的討論的抽象結構顯示了各個子系統(tǒng)之間只有很少的依賴關系,但是具體結構的5個子系統(tǒng)之間有高度的依賴關系。我們可以看出,具體結構中的很多依賴關系并沒有在抽象結構中出現。
Linux內核源代碼
目前,較新而又穩(wěn)定的內核版本是2.0.x和2.2.x,因為版本不同稍有差別,因此如果你想讓一個新的驅動程序既支持2.0.x,又支持2.2.x,就需要根據內核版本進行條件編譯,要作到這一點,就要支持宏LINUX_VERSION_CODE,假如內核的版本用a.b.c來表示,這個宏的值就是216a+28b+c。要用到指定內核版本的值,我們可以用KERNEL_VERSION宏,我們也可以自己去定義它。
對內核的修改用補丁文件的方式發(fā)布的。Patch實用程序用來用來對內核源文件進行一系列的修改。例如:你有2.2.9的源代碼,但想移到2.2.10。就可以獲得2.2.10的補丁文件,應用patch來修改2.2.9源文件。例如:
$nbspcd /usr/src/linux
$nbsppatch –pl nbsppatch-2.2.10
Linux 內核源代碼的結構
nbspLinux內核源代碼位于/usr/src/linux目錄下。
/include子目錄包含了建立內核代碼時所需的大部分包含文件,這個模塊利用其他模塊重建內核。
/init 子目錄包含了內核的初始化代碼,這是內核工作的開始的起點。
/arch子目錄包含了所有硬件結構特定的內核代碼。如:i386,alpha
/drivers子目錄包含了內核中所有的設備驅動程序,如塊設備和SCSI設備。
/fs子目錄包含了所有的文件系統(tǒng)的代碼。如:ext2,vfat等。
/net子目錄包含了內核的連網代碼。
/mm子目錄包含了所有內存管理代碼。
/ipc子目錄包含了進程間通信代碼。
/kernel子目錄包含了主內核代碼。
從何處開始閱讀源代碼?
在Internet,有人制作了源代碼導航器,為閱讀源代碼提供了良好的條件,站點為lxr.linux.no/source。
下面給出閱讀源代碼的線索:
系統(tǒng)的啟動和初始化:
在基于Intel的系統(tǒng)上,當loadlin.exe或LILO把內核裝入到內存并把控制權傳遞給內核時,內核開始啟動。關于這一部分請看,arch/i386/kernel/head.S,head.S進行特定結構的設置,然后跳轉到init/main.c的main()例程。
內存管理:
內存管理的代碼主要在/mm,但是特定結構的代碼在arch/*/mm。缺頁中斷處理的代碼在/mm/memory.c ,而內存映射和頁高速緩存器的代碼在/mm/filemap.c 。緩沖器高速緩存是在/mm/buffer.c 中實現,而交換高速緩存是在mm/swap_state.c和mm/swapfile.c。
內核:
內核中,特定結構的代碼在arch/*/kernel,調度程序在kernel/sched.c,fork的代碼在kernel/fork.c,內核例程處理程序在include/linux/interrupt.h,task_struct數據結構在inlucde/linux/sched.h中。
nbspPCI:
nbspPCI偽驅動程序在drivers/pci/pci.c,其定義在inclulde/linux/pci.h。每一種結構都有一些特定的PCInbspBIOS代碼,Intel的在arch/alpha/kernel/bios32.c中。
進程間通信:
所有的SystemVIPC對象權限都包含在ipc_perm數據結構中,這可以在include/linux/ipc.h中找到。SystemV消息是在ipc/msg.c中實現。共享內存在ipc/shm.c中實現。信號量在ipc/sem.c中,管道在/ipc/pipe.c中實現。
中斷處理:
內核的中斷處理代碼幾乎所有的微處理器特有的。中斷處理代碼在arch/i386/kernel/irq.c中,其定義在include/asm-i386/irq.h中。
評論