解密:Linux內(nèi)核是如何工作的
現(xiàn)在我們隊(duì)Kernel是做什么的已經(jīng)有了一些了解,讓我們再來簡單看下它的物理組成。早期版本的Linux Kernel是整體式的,也就是說所有的部件都靜態(tài)地連接成一個(gè)(很大的)執(zhí)行文件。
相比較而言,現(xiàn)在的Linux Kernel是模塊化的:許多功能包含在模塊內(nèi),然后動(dòng)態(tài)地載入kernel中。這使得kernel的內(nèi)核很小,而且在運(yùn)行kernel時(shí)可以不必reboot就能載入和替代模塊。
Kernel的內(nèi)核在boot time時(shí)從位于/boot 目錄的一個(gè)文件加載進(jìn)存儲(chǔ)中,通常這個(gè)/boot 目錄會(huì)被叫做KERNELVERSION,KERNELVERSION與kernel版本有關(guān)。(如果你想知道你的kernel版本是什么,運(yùn)行命令行顯示系統(tǒng)信息-r。)kernel的模塊位于目錄/lib/modules/KERNELVERSION之下,所有的組件都會(huì)在kernel安裝時(shí)被拷貝。
管理模塊
大部分情況下,Linux管理它的模塊不需要你的幫忙,但是如果必要的時(shí)候有命令行可以來手動(dòng)檢查和管理模塊。比如,為了查清楚當(dāng)前到底哪個(gè)模塊在載入kernel。這里有一個(gè)輸出的例子:
# lsmod
pcspkr 4224 0
hci_usb 18204 2
psmouse 38920 0
bluetooth 55908 7 rfcomm,l2cap,hci_usb
yenta_socket 27532 5
rsrc_nonstatic 14080 1 yenta_socket
isofs 36284 0
輸出的內(nèi)容包括:模塊的名字、大小、使用次數(shù)和依賴于它的模塊列表。使用次數(shù)對防止卸載當(dāng)前活躍的模塊非常總要。Linux只允許使用次數(shù)為零的模塊被移除。
你可以使用modprobe來手動(dòng)加載和卸載模塊,(還有兩個(gè)命令行叫做insmod和rmmod,但modprobe更易于使用因?yàn)樗詣?dòng)移除了模塊依賴)。比如lsmod的輸出在我們的電腦上顯示了一個(gè)名叫isofs的卸載模塊,它的使用次數(shù)是零而且沒有依賴模塊,(isofs是一個(gè)模塊,它支持CD上使用的ISO系統(tǒng)文件格式)這種情況下,kernel會(huì)允許我們卸載模塊:
# modprobe -r isofs
現(xiàn)在,isofs不再顯示在Ismod的輸出中,kernel由此節(jié)省了36,284字節(jié)的存儲(chǔ)。如果你放入CD并且讓它自動(dòng)安裝,kernel將自動(dòng)重新載入isofs模塊,而且isofs的使用次數(shù)增加到1次。如果這時(shí)候你還試圖移除模塊,就不會(huì)成功了因?yàn)樗诒皇褂茫?br />
# modprobe -r isofs
FATAL: Module isofs is in use.
Lsmod只是列出了當(dāng)前被載入的模塊,modprobe則將列出所有可用的模塊,它實(shí)際上輸出了/lib/modules/KERNELVERSION目錄下所有的模塊,名單會(huì)很長!
實(shí)際上,使用modprobe來手動(dòng)加載一個(gè)模塊并不常見,但確實(shí)可以通過modprobe命令行來對模塊設(shè)置參數(shù),例如:
# modprobe usbcore blinkenlights=1
我們并不是在創(chuàng)建blinkenlights,而是usbcore模塊的實(shí)參數(shù)。
那么如何知道一個(gè)模塊會(huì)接受什么參數(shù)呢?一個(gè)比較好的方法是使用modinfo命令,它列出了關(guān)于模塊的種種信息。這里有一個(gè)關(guān)于模塊snd-hda-intel的例子
# modinfo snd-hda-intel
filename: /lib/modules/2.6.20-16-generic/kernel/sound/pci/hda/snd-hda-intel.ko
description: Intel HDA driver
license: GPL
srcversion: A3552B2DF3A932D88FFC00C
alias: pci:v000010DEd0000055Dsv*sd*bc*sc*i*
alias: pci:v000010DEd0000055Csv*sd*bc*sc*i*
depends: snd-pcm,snd-page-alloc,snd-hda-codec,snd
vermagic: 2.6.20-16-generic SMP mod_unload 586
parm: index:Index value for Intel HD audio interface. (int)
parm: id:ID string for Intel HD audio interface. (charp)
parm: model:Use the given board model. (charp)
parm: position_fix:Fix DMA pointer (0 = auto, 1 = none, 2 = POSBUF, 3 = FIFO size). (int)
parm: probe_mask:Bitmask to probe codecs (default = -1). (int)
parm: single_cmd:Use single command to communicate with codecs (for debugging only). (bool)
parm: enable_msi:Enable Message Signaled Interrupt (MSI) (int)
parm: enable:bool
對我們來說比較有興趣的以parm開頭的那些部分:顯示了模塊所接受的參數(shù)。這些描述都比較簡明,如果想要更多的信息,那就安裝kernel的源代碼,在類似于/usr/src/KERNELVERSION/Documentation的目錄下你會(huì)找到。
里面會(huì)有一些有趣的東西,比如文件/usr/src/KERNELVERSION/Documentation/sound/alsa/ALSA-Configuration.txt描述的是被許多ALSA聲音模塊承認(rèn)的參數(shù);/usr/src/KERNELVERSION/Documentation/kernel-parameters.txt這個(gè)文件也很有用。
前幾天在Ubuntu論壇有一個(gè)例子,說的是如何將參數(shù)傳遞到一個(gè)模塊(詳見https://help.ubuntu.com/community/HdaIntelSoundHowto)。實(shí)際上問題的關(guān)鍵是snd-hda-intel參數(shù)在正確驅(qū)動(dòng)聲音硬件時(shí)需要一點(diǎn)操作,而且在boot time加載時(shí)會(huì)中止。解決方法的一部分是將probe_mask=1選項(xiàng)賦給模塊,如果你是手動(dòng)加載模塊,你需要輸入:
# modprobe snd-hda-intel probe_mask=1
更有可能,你在文件/etc/modprobe.conf中放置這樣類似的一行:options snd-hda-intel probe_mask=1
這告訴modprobe每次在加載snd-hda-intel模塊時(shí)包含probe_mask=1選項(xiàng)?,F(xiàn)在的有些Linux版本將這一信息分離進(jìn)/etc/modprobe.d下的不同文件中了,而不是放入modprobe.conf中。
/proc系統(tǒng)文件
Linux kernel同樣通過/proc系統(tǒng)文件來展示了許多細(xì)節(jié)。為了說明/proc,我們首先需要擴(kuò)展我們對于文件的理解。除了認(rèn)為文件就是存儲(chǔ)在硬盤或者CD或者存儲(chǔ)空間上的持久信息之外,我們還應(yīng)當(dāng)把它理解為任何可以通過傳統(tǒng)系統(tǒng)調(diào)用如:打開、讀、寫、關(guān)閉等訪問的信息,當(dāng)然它也可以被常見的程序訪問。
/proc之下的文件完全是kernel虛擬的一個(gè)部分,給我們一個(gè)視角可以看到kernel內(nèi)部的數(shù)據(jù)結(jié)構(gòu)。實(shí)際上,許多Linux的報(bào)告工具均能夠很好地呈現(xiàn)在/proc下的文件中尋到的格式化版本的信息。比如,一列/proc/modules將展示一列當(dāng)前加載的模塊。
同樣的,/proc/meminfo提供了關(guān)于虛擬存儲(chǔ)系統(tǒng)當(dāng)前狀態(tài)的更多細(xì)節(jié)信息,而類如vmstat的工具則是以一種更加可理解的方式提供了相同的一些信息;/proc/net/arp顯示了系統(tǒng)ARP cache的當(dāng)前內(nèi)容,從命令行來說,arp -a顯示的也是相同的信息。
尤其有意思的是/proc/sys下的文件。/proc/sys/net/ipv4/ip_forward下的設(shè)置告訴我們kernel是否將轉(zhuǎn)發(fā)IP數(shù)據(jù)包,也就是說是否扮演網(wǎng)關(guān)的作用?,F(xiàn)在,kernel告訴我們這是關(guān)閉的:
# cat /proc/sys/net/ipv4/ip_forward
0
當(dāng)你發(fā)現(xiàn)你可以對這些文件寫入的時(shí)候,你會(huì)覺得更加有意思。繼續(xù)舉例來說:
# echo 1 > /proc/sys/net/ipv4/ip_forward
將在運(yùn)行的kernel中打開IP 轉(zhuǎn)發(fā)(IP forwarding)
除了使用cat和echo來檢查和更正/proc/sys下的設(shè)置以外,你也可以使用sysctl命令:
# sysctl net.ipv4.ip_forward
net.ipv4.ip_forward = 0
這等同于:
# cat /proc/sys/net/ipv4/ip_forward
0
也等同于:
# sysctl -w net.ipv4.ip_forward=1
net.ipv4.ip_forward = 1
還等同于:
# echo 1 > /proc/sys/net/ipv4/ip_forward
需要注意的是,以這種方式你所做的設(shè)置改變只能影響當(dāng)前運(yùn)行的kernel的,當(dāng)reboot的時(shí)候就不再有效。如果想讓設(shè)置永久有效,將它們放置在/etc/sysctl.conf文件中。在boot time時(shí),sysctl將自動(dòng)重新確定它在此文件下找到的任何設(shè)置。
/etc/sysctl.conf下的代碼行大概是這樣的:net.ipv4.ip_forward=1
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評論