關于uclinux系統(tǒng)分析
簡介
本文引用地址:http://m.butianyuan.cn/article/148508.htmLinux是一種很受歡迎的操作系統(tǒng),它與Unix系統(tǒng)兼容,開放源代碼。它原本被設計為桌面系統(tǒng),現在廣泛應用于服務器領域。而更大的影響在于它正逐漸的應用于嵌入式設備。uClinux正是在這種氛圍下產生的。在uClinux這個英文單詞中u表示Micro,小的意思,C表示Control,控制的意思,所以uClinux就是Micro-CONtrol-Linux,字面上的理解就是針對微控制領域而設計的Linux系統(tǒng)。
uClinux小型化的做法
標準Linux可能采用的小型化方法:
1、重新編譯內核
Linux內核采用模塊化的設計,即很多功能塊可以獨立的加上或卸下,開發(fā)人員在設計內核時把這些內核模塊作為可選的選項,可以在編譯系統(tǒng)內核時指定。因此一種較通用的做法是對Linux內核重新編譯,在編譯時仔細的選擇嵌入式設備所需要的功能支持模塊,同時刪除不需要的功能。通過對內核的重新配置,可以使系統(tǒng)運行所需要的內核顯著減小,從而縮減資源使用量。
2、制作root文件系統(tǒng)映象
Linux系統(tǒng)在啟動時必須加載根(root)文件系統(tǒng),因此剪裁系統(tǒng)同時包括root file system的剪裁。在x86系統(tǒng)下,Linux可以在Dos下,使用Loadlin文件加載啟動。
uClinux采用的小型化方法:
1、uClinux的內核加載方式
uClinux的內核有兩種可選的運行方式:可以在flash上直接運行,也可以加載到內存中運行。這種做法可以減少內存需要。
Flash運行方式:把內核的可執(zhí)行映象燒寫到flash上,系統(tǒng)啟動時從flash的某個地址開始逐句執(zhí)行。這種方法實際上是很多嵌入式系統(tǒng)采用的方法。
內核加載方式:把內核的壓縮文件存放在flash上,系統(tǒng)啟動時讀取壓縮文件在內存里解壓,然后開始執(zhí)行,這種方式相對復雜一些,但是運行速度可能更快(ram的存取速率要比flash高)。同時這也是標準Linux系統(tǒng)采用的啟動方式。
2、uClinux的根(root)文件系統(tǒng)
uClinux系統(tǒng)采用romfs文件系統(tǒng),這種文件系統(tǒng)相對于一般的ext2文件系統(tǒng)要求更少的空間??臻g的節(jié)約來自于兩個方面,首先內核支持romfs文件系統(tǒng)比支持ext2文件系統(tǒng)需要更少的代碼,其次romfs文件系統(tǒng)相對簡單,在建立文件系統(tǒng)超級塊(superblock)需要更少的存儲空間。Romfs文件系統(tǒng)不支持動態(tài)擦寫保存,對于系統(tǒng)需要動態(tài)保存的數據采用虛擬ram盤的方法進行處理(ram盤將采用ext2文件系統(tǒng))。
3、uClinux的應用程序庫
uClinux小型化的另一個做法是重寫了應用程序庫,相對于越來越大且越來越全的glibc庫,uClibc對libc做了精簡。
uClinux對用戶程序采用靜態(tài)連接的形式,這種做法會使應用程序變大,但是基于內存管理的問題,不得不這樣做(這將在下文對uClinux內存管理展開分析時進行說明),同時這種做法也更接近于通常嵌入式系統(tǒng)的做法。
uClinux的開發(fā)環(huán)境
GNU開發(fā)套件
Gnu開發(fā)套件作為通用的Linux開放套件,包括一系列的開發(fā)調試工具。主要組件:
Gcc: 編譯器,可以做成交叉編譯的形式,即在宿主機上開發(fā)編譯目標上可運行的二進制文件。
Binutils:一些輔助工具,包括 objdump(可以反編譯二進制文件),as(匯編編譯器),ld(連接器)等等。
Gdb:調試器,可使用多種交叉調試方式,gdb-bdm (背景調試工具),gdbserver(使用以太網絡調試)。
uClinux的打印終端
通常情況下,uClinux的默認終端是串口,內核在啟動時所有的信息都打印到串口終端(使用printk函數打印),同時也可以通過串口終端與系統(tǒng)交互?! Clinux在啟動時啟動了telnetd(遠程登錄服務),操作者可以遠程登錄上系統(tǒng),從而控制系統(tǒng)的運行。至于是否允許遠程登錄可以通過燒寫romfs文件系統(tǒng)時有用戶決定是否啟動遠程登錄服務。
交叉編譯調試工具
支持一種新的處理器,必須具備一些編譯,匯編工具,使用這些工具可以形成可運行于這種處理器的二進制文件。對于內核使用的編譯工具同應用程序使用的有所不同。在解釋不同點之前,需要對gcc連接做一些說明:
.ld(link description)文件:ld文件是指出連接時內存映象格式的文件。
crt0.S:應用程序編譯連接時需要的啟動文件,主要是初始化應用程序棧。
pic:position independence code ,與位置無關的二進制格式文件,在程序段中必須包括reloc段,從而使的代碼加載時可以進行重新定位。
內核編譯連接時,使用ucsimm.ld文件,形成可執(zhí)行文件映象,所形成的代碼段既可以使用間接尋址方式(即使用reloc段進行尋址),也可以使用絕對尋址方式。這樣可以給編譯器更多的優(yōu)化空間。因為內核可能使用絕對尋址,所以內核加載到的內存地址空間必須與ld文件中給定的內存空間完全相同。
應用程序的連接與內核連接方式不同。應用程序由內核加載(可執(zhí)行文件加載器將在后面討論),由于應用程序的ld文件給出的內存空間與應用程序實際被加載的內存位置可能不同,這樣在應用程序加載的過程中需要一個重新地位的過程,即對reloc段進行修正,使得程序進行間接尋址時不至于出錯。(這個問題在i386等高級處理器上方法有所不同,本文將在后面進一步分析)。
由上述討論,至少需要兩套編譯連接工具。在討論過uClinux的內存管理后本文將給出整個系統(tǒng)的工作流程以及系統(tǒng)在flash和ram中的空間分布。
可執(zhí)行文件格式
先對一些名詞作一些說明:
coff(common object file format):一種通用的對象文件格式
elf(excutive linked file):一種為Linux系統(tǒng)所采用的通用文件格式,支持動態(tài)連接
flat:elf格式有很大的文件頭,flat文件對文件頭和一些段信息做了簡化
uClinux系統(tǒng)使用flat可執(zhí)行文件格式,gcc的編譯器不能直接形成這種文件格式,但是可以形成coff或elf格式的可執(zhí)行文件,這兩種文件需要coff2flt或elf2flt工具進行格式轉化,形成flat文件。
當用戶執(zhí)行一個應用時,內核的執(zhí)行文件加載器將對flat文件進行進一步處理,主要是對reloc段進行修正(可執(zhí)行文件加載器的詳見fs/binfmt_flat.c)。以下對reloc段進一步討論。
需要reloc段的根本原因是,程序在連接時連接器所假定的程序運行空間與實際程序加載到的內存空間不同。假如有這樣一條指令: jsr app_STart;
這一條指令采用直接尋址,跳轉到app_start地址處執(zhí)行,連接程序將在編譯完成是計算出app_start的實際地址(設若實際地址為0x10000),這個實際地址是根據ld文件計算出來(因為連接器假定該程序將被加載到由ld文件指明的內存空間)。但實際上由于內存分配的關系,操作系統(tǒng)在加載時無法保證程序將按ld文件加載。這時如果程序仍然跳轉到絕對地址0x10000處執(zhí)行,通常情況這是不正確的。一個解決辦法是增加一個存儲空間,用于存儲app_start的實際地址,設若使用變量addr表示這個存儲空間。則以上這句程序將改為:
movl addr, a0;
jsr (a0);
增加的變量addr將在數據段中占用一個4字節(jié)的空間,連接器將app_start的絕對地址存儲到該變量。在可執(zhí)行文件加載時,可執(zhí)行文件加載器根據程序將要加載的內存空間計算出app_start在內存中的實際位置,寫入addr變量。系統(tǒng)在實際處理是不需要知道這個變量的確切存儲位置(也不可能知道),系統(tǒng)只要對整個reloc段進行處理就可以了(reloc段有標識,系統(tǒng)可以讀出來)。處理很簡單只需要對reloc段中存儲的值統(tǒng)一加上一個偏置(如果加載的空間比預想的要靠前,實際上是減去一個偏移量)。偏置由實際的物理地址起始值同ld文件指定的地址起始值相減計算出。
這種reloc的方式部分是由uClinux的內存分配問題引起的,這一點將在uClinux內存管理分析時說明。
針對實時性的解決方案
uClinux本身并沒有關注實時問題,它并不是為了Linux的實時性而提出的。另外有一種Linux--Rt-linux關注實時問題。Rt-linux執(zhí)行管理器把普通 Linux 的內核當成一個任務運行,同時還管理了實時進程。而非實時進程則交給普通Linux內核處理。這種方法已經應用于很多的操作系統(tǒng)用于增強操作系統(tǒng)的實時性,包括一些商用版UNIX系統(tǒng),Windows NT等等。這種方法優(yōu)點之一是實現簡單,且實時性能容易檢驗。優(yōu)點之二是由于非實時進程運行于標準Linux系統(tǒng),同其它Linux商用版本之間保持了很大的兼容性。優(yōu)點之三是可以支持硬實時時鐘的應用。uClinux可以使用Rt-linux的patch,從而增強uClinux的實時性,使得uClinux可以應用于工業(yè)控制、進程控制等一些實時要求較高的應用。
uClinux的內存管理
應該說uClinux同標準Linux的最大區(qū)別就在于內存管理,同時也由于uClinux的內存管理引發(fā)了一些標準Linux所不會出現的問題。本文將把uClinux內存管理同標準Linux的那內存管理部分進行比較分析。
1、標準Linux使用的虛擬存儲器技術
標準Linux使用虛擬存儲器技術,這種技術用于提供比計算機系統(tǒng)中實際使用的物理內存大得多的內存空間。使用者將感覺到好像程序可以使用非常大的內存空間,從而使得編程人員在寫程序時不用考慮計算機中的物理內存的實際容量。
為了支持虛擬存儲管理器的管理,Linux系統(tǒng)采用分頁(paging)的方式來載入進程。所謂分頁既是把實際的存儲器分割為相同大小的段,例如每個段1024個字節(jié),這樣1024個字節(jié)大小的段便稱為一個頁面(page)。
虛擬存儲器由存儲器管理機制及一個大容量的快速硬盤存儲器支持。它的實現基于局部性原理,當一個程序在運行之前,沒有必要全部裝入內存,而是僅將那些當前要運行的那些部分頁面或段裝入內存運行(copy-on-write),其余暫時留在硬盤上程序運行時如果它所要訪問的頁(段)已存在,則程序繼續(xù)運行,如果發(fā)現不存在的頁(段),操作系統(tǒng)將產生一個頁錯誤(pagefault),這個錯誤導致操作系統(tǒng)把需要運行的部分加載到內存中。必要時操作系統(tǒng)還可以把不需要的內存頁(段)交換到磁盤上。利用這樣的方式管理存儲器,便可把一個進程所需要用到的存儲器以化整為零的方式,視需求分批載入,而核心程序則憑借屬于每個頁面的頁碼來完成尋址各個存儲器區(qū)段的工作。
標準Linux是針對有內存管理單元的處理器設計的。在這種處理器上,虛擬地址被送到內存管理單元(MMU),把虛擬地址映射為物理地址。
通過賦予每個任務不同的虛擬--物理地址轉換映射,支持不同任務之間的保護。地址轉換函數在每一個任務中定義,在一個任務中的虛擬地址空間映射到物理內存的一個部分,而另一個任務的虛擬地址空間映射到物理存儲器中的另外區(qū)域。計算機的存儲管理單元(MMU)一般有一組寄存器來標識當前運行的進程的轉換表。在當前進程將CPU放棄給另一個進程時(一次上下文切換),內核通過指向新進程地址轉換表的指針加載這些寄存器。MMU寄存器是有特權的,只能在內核態(tài)才能訪問。這就保證了一個進程只能訪問自己用戶空間內的地址,而不會訪問和修改其它進程的空間。當可執(zhí)行文件被加載時,加載器根據缺省的ld文件,把程序加載到虛擬內存的一個空間,因為這個原因實際上很多程序的虛擬地址空間是相同的,但是由于轉換函數不同,所以實際所處的內存區(qū)域也不同。而對于多進程管理當處理器進行進程切換并執(zhí)行一個新任務時,一個重要部分就是為新任務切換任務轉換表。我們可以看到Linux系統(tǒng)的內存管理至少實現了以下功能:
運行比內存還要大的程序。理想情況下應該可以運行任意大小的程序:
可以運行只加載了部分的程序,縮短了程序啟動的時間
可以使多個程序同時駐留在內存中提高CPU的利用率
可以運行重定位程序。即程序可以方于內存中的任何一處,而且可以在執(zhí)行過程中移動。
寫機器無關的代碼。程序不必事先約定機器的配置情況。
減輕程序員分配和管理內存資源的負擔。
可以進行共享--例如,如果兩個進程運行同一個程序,它們應該可以共享程序代碼的同一個副本。
提供內存保護,進程不能以非授權方式訪問或修改頁面,內核保護單個進程的數據和代碼以防止其它進程修改它們。否則,用戶程序可能會偶然(或惡意)的破壞內核或其它用戶程序。
虛存系統(tǒng)并不是沒有代價的。 內存管理需要地址轉換表和其他一些數據結構,留給程序的內存減少了。地址轉換增加了每一條指令的執(zhí)行時間,而對于有額外內存操作的指令會更嚴重。當進程訪問不在內存的頁面時,系統(tǒng)發(fā)生失效。系統(tǒng)處理該失效,并將頁面加載到內存中,這需要極耗時間的磁盤I/O操作??傊畠却婀芾砘顒诱加昧讼喈斠徊糠謈pu時間(在較忙的系統(tǒng)中大約占10%)。
2、uClinux針對NOMMU的特殊處理
對于uClinux來說,其設計針對沒有MMU的處理器,即uClinux不能使用處理器的虛擬內存管理技術(應該說這種不帶有MMU的處理器在嵌入式設備中相當普偏)。uClinux仍然采用存儲器的分頁管理,系統(tǒng)在啟動時把實際存儲器進行分頁。在加載應用程序時程序分頁加載。但是由于沒有MMU管理,所以實際上uClinux采用實存儲器管理策略(real memeory management)。這一點影響了系統(tǒng)工作的很多方面。
uClinux系統(tǒng)對于內存的訪問是直接的,(它對地址的訪問不需要經過MMU,而是直接送到地址線上輸出),所有程序中訪問的地址都是實際的物理地址。操作系統(tǒng)對內存空間沒有保護(這實際上是很多嵌入式系統(tǒng)的特點),各個進程實際上共享一個運行空間(沒有獨立的地址轉換表)。
一個進程在執(zhí)行前, 系統(tǒng)必須為進程分配足夠的連續(xù)地址空間,然后全部載入主存儲器的連續(xù)空間中。與之相對應的是標準Linux系統(tǒng)在分配內存時沒有必要保證實際物理存儲空間是連續(xù)的,而只要保證虛存地址空間連續(xù)就可以了。另外一個方面程序加載地址與預期(ld文件中指出的)通常都不相同,這樣relocation過程就是必須的。此外磁盤交換空間也是無法使用的,系統(tǒng)執(zhí)行時如果缺少內存將無法通過磁盤交換來得到改善。
uClinux對內存的管理減少同時就給開發(fā)人員提出了更高的要求。如果從易用性這一點來說,uClinux的內存管理是一種倒退,退回了到了Unix早期或是Dos系統(tǒng)時代。開發(fā)人員不得不參與系統(tǒng)的內存管理。從編譯內核開始,開發(fā)人員必須告訴系統(tǒng)這塊開發(fā)板到底擁有多少的內存(假如你欺騙了系統(tǒng),那將在后面運行程序時受到懲罰),從而系統(tǒng)將在啟動的初始化階段對內存進行分頁,并且標記已使用的和未使用的內存。系統(tǒng)將在運行應用時使用這些分頁內存。
由于應用程序加載時必須分配連續(xù)的地址空間,而針對不同硬件平臺的可一次成塊(連續(xù)地址)分配內存大小限制是不同(目前針對ez328處理器的uClinux是128k,而針對coldfire處理器的系統(tǒng)內存則無此限制),所以開發(fā)人員在開發(fā)應用程序時必須考慮內存的分配情況并關注應用程序需要運行空間的大小。另外由于采用實存儲器管理策略,用戶程序同內核以及其它用戶程序在一個地址空間,程序開發(fā)時要保證不侵犯其它程序的地址空間,以使得程序不至于破壞系統(tǒng)的正常工作,或導致其它程序的運行異常。
從內存的訪問角度來看,開發(fā)人員的權利增大了(開發(fā)人員在編程時可以訪問任意的地址空間),但與此同時系統(tǒng)的安全性也大為下降。此外,系統(tǒng)對多進程的管理將有很大的變化,這一點將在uClinux的多進程管理中說明。
雖然uClinux的內存管理與標準Linux系統(tǒng)相比功能相差很多,但應該說這是嵌入式設備的選擇。在嵌入式設備中,由于成本等敏感因素的影響,普偏的采用不帶有MMU的處理器,這決定了系統(tǒng)沒有足夠的硬件支持實現虛擬存儲管理技術。從嵌入式設備實現的功能來看,嵌入式設備通常在某一特定的環(huán)境下運行,只要實現特定的功能,其功能相對簡單,內存管理的要求完全可以由開發(fā)人員考慮。
3、標準Linux系統(tǒng)的進程、線程
進程:進程是一個運行程序并為其提供執(zhí)行環(huán)境的實體,它包括一個地址空間和至少一個控制點,進程在這個地址空間上執(zhí)行單一指令序列。進程地址空間包括可以訪問或引用的內存單元的集合,進程控制點通過一個一般稱為程序計數器(program counter,PC)的硬件寄存器控制和跟蹤進程指令序列。
fork:由于進程為執(zhí)行程序的環(huán)境,因此在執(zhí)行程序前必須先建立這個能跑程序的環(huán)境。Linux系統(tǒng)提供系統(tǒng)調用拷貝現行進程的內容,以產生新的進程,調用fork的進程稱為父進程;而所產生的新進程則稱為子進程。子進程會承襲父進程的一切特性,但是它有自己的數據段,也就是說,盡管子進程改變了所屬的變量,卻不會影響到父進程的變量值。
父進程和子進程共享一個程序段,但是各自擁有自己的堆棧、數據段、用戶空間以及進程控制塊。換言之,兩個進程執(zhí)行的程序代碼是一樣的,但是各有各的程序計數器與自己的私人數據。
當內核收到fork請求時,它會先查核三件事:首先檢查存儲器是不是足夠;其次是進程表是否仍有空缺;最后則是看看用戶是否建立了太多的子進程。如果上述說三個條件滿足,那么操作系統(tǒng)會給子進程一個進程識別碼,并且設定cpu時間,接著設定與父進程共享的段,同時將父進程的inode拷貝一份給子進程運用,最終子進程會返回數值0以表示它是子進程,至于父進程,它可能等待子進程的執(zhí)行結束,或與子進程各做個的。
exec系統(tǒng)調用:該系統(tǒng)調用提供一個進程去執(zhí)行另一個進程的能力,exec系統(tǒng)調用是采用覆蓋舊有進程存儲器內容的方式,所以原來程序的堆棧、數據段與程序段都會被修改,只有用戶區(qū)維持不變。
vfork系統(tǒng)調用:由于在使用fork時,內核會將父進程拷貝一份給子進程,但是這樣的做法相當浪費時間,因為大多數的情形都是程序在調用fork后就立即調用exec,這樣剛拷貝來的進程區(qū)域又立即被新的數據覆蓋掉。因此Linux系統(tǒng)提供一個系統(tǒng)調用vfork,vfork假定系統(tǒng)在調用完成vfork后會馬上執(zhí)行exec,因此vfork不拷貝父進程的頁面,只是初始化私有的數據結構與準備足夠的分頁表。這樣實際在vfork調用完成后父子進程事實上共享同一塊存儲器(在子進程調用exec或是exit之前),因此子進程可以更改父進程的數據及堆棧信息,因此vfork系統(tǒng)調用完成后,父進程進入睡眠,直到子進程執(zhí)行exec。當子進程執(zhí)行exec時,由于exec要使用被執(zhí)行程序的數據,代碼覆蓋子進程的存儲區(qū)域,這樣將產生寫保護錯誤(do_wp_page)(這個時候子進程寫的實際上是父進程的存儲區(qū)域),這個錯誤導致內核為子進程重新分配存儲空間。當子進程正確開始執(zhí)行后,將喚醒父進程,使得父進程繼續(xù)往后執(zhí)行。
4、uClinux的多進程處理
uClinux沒有mmu管理存儲器,在實現多個進程時(fork調用生成子進程)需要實現數據保護。
uClinux的fork和vfork:uClinux的fork等于vfork。實際上uClinux的多進程管理通過vfork來實現。這意味著uClinux系統(tǒng)fork調用完程后,要么子進程代替父進程執(zhí)行(此時父進程已經sleep)直到子進程調用exit退出,要么調用exec執(zhí)行一個新的進程,這個時候將產生可執(zhí)行文件的加載,即使這個進程只是父進程的拷貝,這個過程也不能避免。當子進程執(zhí)行exit或exec后,子進程使用wakeup把父進程喚醒,父進程繼續(xù)往下執(zhí)行。
uClinux的這種多進程實現機制同它的內存管理緊密相關。uClinux針對nommu處理器開發(fā),所以被迫使用一種flat方式的內存管理模式,啟動新的應用程序時系統(tǒng)必須為應用程序分配存儲空間,并立即把應用程序加載到內存。缺少了MMU的內存重映射機制,uClinux必須在可執(zhí)行文件加載階段對可執(zhí)行文件reloc處理,使得程序執(zhí)行時能夠直接使用物理內存。
評論