ARM Linux 的啟動過程
1. kernel運(yùn)行的史前時期和內(nèi)存布局
本文引用地址:http://m.butianyuan.cn/article/201611/318000.htm在arm平臺下,zImage.bin壓縮鏡像是由bootloader加載到物理內(nèi)存,然后跳到zImage.bin里一段程序,它專門于將被壓縮的kernel解壓縮到KERNEL_RAM_PADDR開始的一段內(nèi)存中,接著跳進(jìn)真正的kernel去執(zhí)行。該kernel的執(zhí)行起點(diǎn)是stext函數(shù),定義于arch/arm/kernel/head.S。
在分析stext函數(shù)前,先介紹此時內(nèi)存的布局如下圖所示
在開發(fā)板tqs3c2440中,SDRAM連接到內(nèi)存控制器的Bank6中,它的開始內(nèi)存地址是0x30000000,大小為64M,即0x20000000。 ARM Linux kernel將SDRAM的開始地址定義為PHYS_OFFSET。經(jīng)bootloader加載kernel并由自解壓部分代碼運(yùn)行后,最終kernel被放置到KERNEL_RAM_PADDR(=PHYS_OFFSET + TEXT_OFFSET,即0x30008000)地址上的一段內(nèi)存,經(jīng)此放置后,kernel代碼以后均不會被移動。
在進(jìn)入kernel代碼前,即bootloader和自解壓縮階段,ARM未開啟MMU功能。因此kernel啟動代碼一個重要功能是設(shè)置好相應(yīng)的頁表,并開啟MMU功能。為了支持MMU功能,kernel鏡像中的所有符號,包括代碼段和數(shù)據(jù)段的符號,在鏈接時都生成了它在開啟MMU時,所在物理內(nèi)存地址映射到的虛擬內(nèi)存地址。
以arm kernel第一個符號(函數(shù))stext為例,在編譯鏈接,它生成的虛擬地址是0xc0008000,而放置它的物理地址為0x30008000(還記得這是PHYS_OFFSET+TEXT_OFFSET嗎?)。實際上這個變換可以利用簡單的公式進(jìn)行表示:va = pa – PHYS_OFFSET + PAGE_OFFSET。Arm linux最終的kernel空間的頁表,就是按照這個關(guān)系來建立。
之所以較早提及arm linux 的內(nèi)存映射,原因是在進(jìn)入kernel代碼,里面所有符號地址值為清一色的0xCXXXXXXX地址,而此時ARM未開啟MMU功能,故在執(zhí)行stext函數(shù)第一條執(zhí)行時,它的PC值就是stext所在的內(nèi)存地址(即物理地址,0x30008000)。因此,下面有些代碼,需要使用地址無關(guān)技術(shù)。
2.一覽stext函數(shù)
stext函數(shù)定義在Arch/arm/kernel/head.S,它的功能是獲取處理器類型和機(jī)器類型信息,并創(chuàng)建臨時的頁表,然后開啟MMU功能,并跳進(jìn)第一個C語言函數(shù)start_kernel。
stext函數(shù)的在前置條件是:MMU, D-cache, 關(guān)閉; r0 = 0, r1 = machine nr, r2 = atags prointer.
代碼如下:
- .section".text.head","ax"
- (stext)
- /*設(shè)置CPU運(yùn)行模式為SVC,并關(guān)中斷*/
- msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
- @andirqsdisabled
- mrcp15,0,r9,c0,c0@getprocessorid
- bl__lookup_processor_type@r5=procinfor9=cupid
- /*r10指向cpu對應(yīng)的proc_info記錄*/
- movsr10,r5@invalidprocessor(r5=0)?
- beq__error_p@yes,errorp
- bl__lookup_machine_type@r5=machinfo
- /*r8指向開發(fā)板對應(yīng)的arch_info記錄*/
- movsr8,r5@invalidmachine(r5=0)?
- beq__error_a@yes,errora
- /*__vet_atags函數(shù)涉及bootloader造知kernel物理內(nèi)存的情況,我們暫時不分析它。*/
- bl__vet_atags
- /*創(chuàng)建臨時頁表*/
- bl__create_page_tables
- /*
- *ThefollowingcallsCPUspecificcodeinapositionindependent
- *manner.Seearch/arm/mm/proc-*.Sfordetails.r10=baseof
- *xxx_proc_infostructureselectedby__lookup_machine_type
- *above.Onreturn,theCPUwillbereadyfortheMMUtobe
- *turnedon,andr0willholdtheCPUcontrolregistervalue.
- */
- /*這里的邏輯關(guān)系相當(dāng)復(fù)雜,先是從proc_info結(jié)構(gòu)中的中跳進(jìn)__arm920_setup函數(shù),
- *然后執(zhí)__enable_mmu函數(shù)。最后在__enable_mmu函數(shù)通過movpc,r13來執(zhí)行__switch_data,
- *__switch_data函數(shù)在最后一條語句,魚躍龍門,跳進(jìn)第一個C語言函數(shù)start_kernel。
- */
- ldrr13,__switch_data@addresstojumptoafter
- @mmuhasbeenenabled
- adrlr,__enable_mmu@return(PIC)address
- addpc,r10,#PROCINFO_INITFUNC
- OC(stext)
- .section".text.head","ax"
- (stext)
- /*設(shè)置CPU運(yùn)行模式為SVC,并關(guān)中斷*/
- msrcpsr_c,#PSR_F_BIT|PSR_I_BIT|SVC_MODE@ensuresvcmode
- @andirqsdisabled
- mrcp15,0,r9,c0,c0@getprocessorid
- bl__lookup_processor_type@r5=procinfor9=cupid
- /*r10指向cpu對應(yīng)的proc_info記錄*/
- movsr10,r5@invalidprocessor(r5=0)?
- beq__error_p@yes,errorp
- bl__lookup_machine_type@r5=machinfo
- /*r8指向開發(fā)板對應(yīng)的arch_info記錄*/
- movsr8,r5@invalidmachine(r5=0)?
- beq__error_a@yes,errora
- /*__vet_atags函數(shù)涉及bootloader造知kernel物理內(nèi)存的情況,我們暫時不分析它。*/
- bl__vet_atags
- /*創(chuàng)建臨時頁表*/
- bl__create_page_tables
- /*
- *ThefollowingcallsCPUspecificcodeinapositionindependent
- *manner.Seearch/arm/mm/proc-*.Sfordetails.r10=baseof
- *xxx_proc_infostructureselectedby__lookup_machine_type
- *above.Onreturn,theCPUwillbereadyfortheMMUtobe
- *turnedon,andr0willholdtheCPUcontrolregistervalue.
- */
- /*這里的邏輯關(guān)系相當(dāng)復(fù)雜,先是從proc_info結(jié)構(gòu)中的中跳進(jìn)__arm920_setup函數(shù),
- *然后執(zhí)__enable_mmu函數(shù)。最后在__enable_mmu函數(shù)通過movpc,r13來執(zhí)行__switch_data,
- *__switch_data函數(shù)在最后一條語句,魚躍龍門,跳進(jìn)第一個C語言函數(shù)start_kernel。
- */
- ldrr13,__switch_data@addresstojumptoafter
- @mmuhasbeenenabled
- adrlr,__enable_mmu@return(PIC)address
- addpc,r10,#PROCINFO_INITFUNC
- OC(stext)
3 __lookup_processor_type 函數(shù)
__lookup_processor_type 函數(shù)是一個非常講究技巧的函數(shù),如果你將它領(lǐng)會,也將領(lǐng)會kernel了一些魔法。
Kernel代碼將所有CPU信息的定義都放到.proc.info.init段中,因此可以認(rèn)為.proc.info.init段就是一個數(shù)組,每個元素都定義了一個或一種CPU的信息。目前__lookup_processor_type使用該元素的前兩個字段cpuid和mask來匹配當(dāng)前CPUID,如果滿足CPUID & mask == cpuid,則找到當(dāng)前cpu的定義并返回。
下面是tqs3c2440開發(fā)板,CPU的定義信息,cpuid = 0x41009200,mask = 0xff00fff0。如果是碼是運(yùn)行在tqs3c2440開發(fā)板上,那么函數(shù)返回下面的定義:
- .section".proc.info.init",#alloc,#execinstr
- .type__arm920_proc_info,#object
- __arm920_proc_info:
- .long0x41009200
- .long0xff00fff0
- .longPMD_TYPE_SECT|
- PMD_SECT_BUFFERABLE|
- PMD_SECT_CACHEABLE|
- PMD_BIT4|
- PMD_SECT_AP_WRITE|
- PMD_SECT_AP_READ
- .longPMD_TYPE_SECT|
- PMD_BIT4|
- PMD_SECT_AP_WRITE|
- PMD_SECT_AP_READ
- /*__arm920_setup函數(shù)在stext的未尾被調(diào)用,請往回看。*/
- b__arm920_setup
- .longcpu_arch_name
- .longcpu_elf_name
- .longHWCAP_SWP|HWCAP_HALF|HWCAP_THUMB
- .longcpu_arm920_name
- .longarm920_processor_functions
- .longv4wbi_tlb_fns
- .longv4wb_user_fns
- #ifndefCONFIG_CPU_DCACHE_WRITETHROUGH
- .longarm920_cache_fns
- #else
- .longv4wt_cache_fns
- #endif
- .size__arm920_proc_info,.-__arm920_proc_info
- .section".proc.info.init",#alloc,#execinstr
- .type__arm920_proc_info,#object
- __arm920_proc_info:
- .long0x41009200
- .long0xff00fff0
- .longPMD_TYPE_SECT|
- PMD_SECT_BUFFERABLE|
- PMD_SECT_CACHEABLE|
- PMD_BIT4|
- PMD_SECT_AP_WRITE|
- PMD_SECT_AP_READ
- .longPMD_TYPE_SECT|
- PMD_BIT4|
- PMD_SECT_AP_WRITE|
- PMD_SECT_AP_READ
- /*__arm920_setup函數(shù)在stext的未尾被調(diào)用,請往回看。*/
- b__arm920_setup
- .longcpu_arch_name
- .longcpu_elf_name
- .longHWCAP_SWP|HWCAP_HALF|HWCAP_THUMB
- .longcpu_arm920_name
- .longarm920_processor_functions
- .longv4wbi_tlb_fns
- .longv4wb_user_fns
- #ifndefCONFIG_CPU_DCACHE_WRITETHROUGH
- .longarm920_cache_fns
- #else
- .longv4wt_cache_fns
- #endif
- .size__arm920_proc_info,.-__arm920_proc_info
- /*
- *ReadprocessorIDregister(CP#15,CR0),andlookupinthelinker-built
- *supportedprocessorlist.Notethatwecantusetheabsoluteaddresses
- *forthe__proc_infolistssincewearentrunningwiththeMMUon
- *(andtherefore,wearenotinthecorrectaddressspace).Wehaveto
- *calculatetheoffset.
- *
- *r9=cpuid
- *Returns:
- *r3,r4,r6corrupted
- *r5=proc_infopointerinphysicaladdressspace
- *r9=cpuid(preserved)
- */
- __lookup_processor_type:
- /*adr是相對尋址,它的尋計算結(jié)果是將當(dāng)前PC值加上3f符號與PC的偏移量,
- *而PC是物理地址,因此r3的結(jié)果也是3f符號的物理地址*/
- adrr3,3f
- /*r5值為__proc_info_bein,r6值為__proc_ino_end,而r7值為.,
- *也即3f符號的鏈接地址。請注意,在鏈接期間,__proc_info_begin和
- *__proc_info_end以及.均是鏈接地址,也即虛執(zhí)地址。
- */
- ldmdar3,{r5-r7}
- /*r3為3f的物理地址,而r7為3f的虛擬地址。結(jié)果是r3為虛擬地址與物理地址的差值,即PHYS_OFFSET-PAGE_OFFSET。*/
- subr3,r3,r7@getoffsetbetweenvirt&phys
- /*r5為__proc_info_begin的物理地址,即r5指針__proc_info數(shù)組的首地址*/
- addr5,r5,r3@convertvirtaddressesto
- /*r6為__proc_info_end的物理地址*/
- addr6,r6,r3@physicaladdressspace
- /*讀取r5指向的__proc_info數(shù)組元素的CPUID和mask值*/
- 1:ldmiar5,{r3,r4}@value,mask
- /*將當(dāng)前CPUID和mask相與,并與數(shù)組元素中的CPUID比較是否相同
- *若相同,則找到當(dāng)前CPU的__proc_info定義,r5指向訪元素并返回。
- */
- andr4,r4,r9@maskwantedbits
- teqr3,r4
- beq2f
- /*r5指向下一個__proc_info元素*/
- addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
- /*是否遍歷完所有__proc_info元素*/
- cmpr5,r6
- blo1b
- /*找不到則返回NULL*/
- movr5,#0@unknownprocessor
- 2:movpc,lr
- ENDPROC(__lookup_processor_type)
- .long__proc_info_begin
- .long__proc_info_end
- 3:.long.
- .long__arch_info_begin
- .long__arch_info_end
- /*
- *ReadprocessorIDregister(CP#15,CR0),andlookupinthelinker-built
- *supportedprocessorlist.Notethatwecantusetheabsoluteaddresses
- *forthe__proc_infolistssincewearentrunningwiththeMMUon
- *(andtherefore,wearenotinthecorrectaddressspace).Wehaveto
- *calculatetheoffset.
- *
- *r9=cpuid
- *Returns:
- *r3,r4,r6corrupted
- *r5=proc_infopointerinphysicaladdressspace
- *r9=cpuid(preserved)
- */
- __lookup_processor_type:
- /*adr是相對尋址,它的尋計算結(jié)果是將當(dāng)前PC值加上3f符號與PC的偏移量,
- *而PC是物理地址,因此r3的結(jié)果也是3f符號的物理地址*/
- adrr3,3f
- /*r5值為__proc_info_bein,r6值為__proc_ino_end,而r7值為.,
- *也即3f符號的鏈接地址。請注意,在鏈接期間,__proc_info_begin和
- *__proc_info_end以及.均是鏈接地址,也即虛執(zhí)地址。
- */
- ldmdar3,{r5-r7}
- /*r3為3f的物理地址,而r7為3f的虛擬地址。結(jié)果是r3為虛擬地址與物理地址的差值,即PHYS_OFFSET-PAGE_OFFSET。*/
- subr3,r3,r7@getoffsetbetweenvirt&phys
- /*r5為__proc_info_begin的物理地址,即r5指針__proc_info數(shù)組的首地址*/
- addr5,r5,r3@convertvirtaddressesto
- /*r6為__proc_info_end的物理地址*/
- addr6,r6,r3@physicaladdressspace
- /*讀取r5指向的__proc_info數(shù)組元素的CPUID和mask值*/
- 1:ldmiar5,{r3,r4}@value,mask
- /*將當(dāng)前CPUID和mask相與,并與數(shù)組元素中的CPUID比較是否相同
- *若相同,則找到當(dāng)前CPU的__proc_info定義,r5指向訪元素并返回。
- */
- andr4,r4,r9@maskwantedbits
- teqr3,r4
- beq2f
- /*r5指向下一個__proc_info元素*/
- addr5,r5,#PROC_INFO_SZ@sizeof(proc_info_list)
- /*是否遍歷完所有__proc_info元素*/
- cmpr5,r6
- blo1b
- /*找不到則返回NULL*/
- movr5,#0@unknownprocessor
- 2:movpc,lr
- ENDPROC(__lookup_processor_type)
- .long__proc_info_begin
- .long__proc_info_end
- 3:.long.
- .long__arch_info_begin
- .long__arch_info_end
4 __lookup_machine_type 函數(shù)
__lookup_machine_type 和__lookup_processor_type像對孿生兄弟,它們的行為都是很類似的:__lookup_machine_type根據(jù)r1寄存器的機(jī)器編號到.arch.info.init段的數(shù)組中依次查找機(jī)器編號與r1相同的記錄。它使了與它孿生兄弟同樣的手法進(jìn)行虛擬地址到物理地址的轉(zhuǎn)換計算。
在介紹函數(shù),我們先分析tqs3c2440開發(fā)板的機(jī)器信息的定義:
- Arch/arm/include/asm/mach/arch.h
- #defineMACHINE_START(_type,_name)
- staticconststructmachine_desc__mach_desc_##_type
- __used
- __attribute__((__section__(".arch.info.init")))={
- .nr=MACH_TYPE_##_type,
- .name=_name,
- #defineMACHINE_END
- };
- Arch/arm/include/asm/mach/arch.h
- #defineMACHINE_START(_type,_name)
- staticconststructmachine_desc__mach_desc_##_type
- __used
- __attribute__((__section__(".arch.info.init")))={
- .nr=MACH_TYPE_##_type,
- .name=_name,
- #defineMACHINE_END
- };
MACHINE_START宏用于定義一個.arch.info.init段的數(shù)組元素。.nr元素就是函數(shù)要比較的變量。Tqs3c2440開發(fā)板相應(yīng)的定義如下:
- MACHINE_START(S3C2440,"TQ2440")
- .phys_io=S3C2410_PA_UART,
- .io_pg_offst=(((u32)S3C24XX_VA_UART)>>18)&0xfffc,
- .boot_params=S3C2410_SDRAM_PA+0x100,
- .init_irq=s3c24xx_init_irq,
- .map_io=tq2440_map_io,
- .init_machine=tq2440_machine_init,
- .timer=&s3c24xx_timer,
- MACHINE_END
- MACHINE_START(S3C2440,"TQ2440")
- .phys_io=S3C2410_PA_UART,
- .io_pg_offst=(((u32)S3C24XX_VA_UART)>>18)&0xfffc,
- .boot_params=S3C2410_SDRAM_PA+0x100,
- .init_irq=s3c24xx_init_irq,
- .map_io=tq2440_map_io,
- .init_machine=tq2440_machine_init,
- .timer=&s3c24xx_timer,
- MACHINE_END
這是一個struct machine_desc結(jié)構(gòu),在后面的C代碼(start_kernel開始執(zhí)行的代碼)會使用該變量對象。在tqs3c2440開發(fā)中的__lookup_machine_type函數(shù)就是返回該對象指針。
這里涉及很多函數(shù)指針,它們都是在start_kernel函數(shù)里在各種階段進(jìn)行初始化的回函數(shù)。如map_io指向的tq2440_map_io就是在建立好內(nèi)核頁表后,再調(diào)用它來針對開發(fā)板的各種IO端口來建立相關(guān)的映射和頁表。
至于__loopup_machine_type的代碼就不作詳細(xì)分析,請對比__lookup_processor_type來自行分析。代碼如下:
- /*
- *Lookupmachinearchitectureinthelinker-buildlistofarchitectures.
- *Notethatwecantusetheabsoluteaddressesforthe__arch_info
- *listssincewearentrunningwiththeMMUon(andtherefore,weare
- *notinthecorrectaddressspace).Wehavetocalculatetheoffset.
- *
- *r1=machinearchitecturenumber
- *Returns:
- *r3,r4,r6corrupted
- *r5=mach_infopointerinphysicaladdressspace
- */
- __lookup_machine_type:
- adrr3,3b
- ldmiar3,{r4,r5,r6}
- subr3,r3,r4@getoffsetbetweenvirt&phys
- addr5,r5,r3@convertvirtaddressesto
- addr6,r6,r3@physicaladdressspace
- 1:ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
- teqr3,r1@matchesloadernumber?
- beq2f@found
- addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
- cmpr5,r6
- blo1b
- movr5,#0@unknownmachine
- 2:movpc,lr
- ENDPROC(__lookup_machine_type)
- /*
- *Lookupmachinearchitectureinthelinker-buildlistofarchitectures.
- *Notethatwecantusetheabsoluteaddressesforthe__arch_info
- *listssincewearentrunningwiththeMMUon(andtherefore,weare
- *notinthecorrectaddressspace).Wehavetocalculatetheoffset.
- *
- *r1=machinearchitecturenumber
- *Returns:
- *r3,r4,r6corrupted
- *r5=mach_infopointerinphysicaladdressspace
- */
- __lookup_machine_type:
- adrr3,3b
- ldmiar3,{r4,r5,r6}
- subr3,r3,r4@getoffsetbetweenvirt&phys
- addr5,r5,r3@convertvirtaddressesto
- addr6,r6,r3@physicaladdressspace
- 1:ldrr3,[r5,#MACHINFO_TYPE]@getmachinetype
- teqr3,r1@matchesloadernumber?
- beq2f@found
- addr5,r5,#SIZEOF_MACHINE_DESC@nextmachine_desc
- cmpr5,r6
- blo1b
- movr5,#0@unknownmachine
- 2:movpc,lr
- ENDPROC(__lookup_machine_type)
5. 為kernel建立臨時頁表
前面提及到,kernel里面的所有符號在鏈接時,都使用了虛擬地址值。在完成基本的初始化后,kernel代碼將跳到第一個C語言函數(shù)start_kernl來執(zhí)行,在哪個時候,這些虛擬地址必須能夠?qū)λ娣旁谡嬲齼?nèi)存位置,否則運(yùn)行將為出錯。為此,CPU必須開啟MMU,但在開啟MMU前,必須為虛擬地址到物理地址的映射建立相應(yīng)的面表。在開啟MMU后,kernel指并不馬上將PC值指向start_kernl,而是要做一些C語言運(yùn)行期的設(shè)置,如堆棧,重定義等工作后才跳到start_kernel去執(zhí)行。在此過程中,PC值還是物理地址,因此還需要為這段內(nèi)存空間建立va = pa的內(nèi)存映射關(guān)系。當(dāng)然,本函數(shù)建立的所有頁表都會在將來paging_init銷毀再重建,這是臨時過度性的映射關(guān)系和頁表。
在介紹__create_table_pages前,先認(rèn)識一個macro pgtbl,它將KERNL_RAM_PADDR – 0x4000的值賦給rd寄存器,從下面的使用中可以看它,該值是頁表在物理內(nèi)存的基礎(chǔ),也即頁表放在kernel開始地址下的16K的地方。
- .macropgtbl,rd
- ldrrd,=(KERNEL_RAM_PADDR-0x4000)
- .endm
- .macropgtbl,rd
- ldrrd,=(KERNEL_RAM_PADDR-0x4000)
- .endm
- /*
- *Setuptheinitialpagetables.Weonlysetupthebarest
- *amountwhicharerequiredtogetthekernelrunning,which
- *generallymeansmappinginthekernelcode.
- *
- *r8=machinfo
- *r9=cpuid
- *r10=procinfo
- *
- *Returns:
- *r0,r3,r6,r7corrupted
- *r4=physicalpagetableaddress
- */
- __create_page_tables:
- /*r4=KERNEL_RAM_PADDR–0x4000=0x30004000
- *后面的C代碼中的swapper_pg_dir變量,它的值也指向0x30004000
- *內(nèi)存地址,不過它的值是虛擬內(nèi)存地址,即0xc0004000
- */
- pgtblr4@pagetableaddress
- /*將從r4到KERNEL_RAP_PADDR的16K頁表空間清空。*/
- movr0,r4
- movr3,#0
- addr6,r0,#0x4000
- 1:strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- teqr0,r6
- bne1b
- /*還記得r10指向開發(fā)板相應(yīng)的proc_info元素嗎?這里它將的mm_mmuflags值讀到r7中。
- *PROCINFO_MM_MMUFLAGS值為8,可對應(yīng)上面列出來的__arm920_proc_info結(jié)構(gòu)或你相應(yīng)開發(fā)板結(jié)構(gòu)的值來查看該mmu_flags值。
- *這里的flags就是用于設(shè)置目錄項的flags。查看該mmu_flags的定義,發(fā)現(xiàn)它是要求一級頁表是section。
- */
- ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags
- /*
- *CreateidentitymappingforfirstMBofkernelto
- *caterfortheMMUenable.Thisidentitymapping
- *willberemovedbypaging_init().Weuseourcurrentprogram
- *countertodeterminecorrespondingsectionbaseaddress.
- */
- /*r3=((pc>>20)<<20)|r7,即取PC以1M向下對齊的地址。R6=pc>>20也即r6=0x300(pgd_idx),
- *即PC對所有1M內(nèi)存空間,在頁表中的下標(biāo)。
- *R7值表明該目錄項是section,即它映射的大小是1M。故剛好一個目錄項就可以映射kernel上的1M空間。
- *這個暫時的va=pa映射只建立1M大小內(nèi)存的,而不需要建立整個kernel鏡像范圍的映射。
- *因為這個va=pa的映射只有當(dāng)前匯編語言才使用,一量跳進(jìn)start_kernl后,這將不會用到了。而匯編代碼在鏈接時,
- *已將它安排到代碼段的最前面了。
- movr6,pc,lsr#20@startofkernelsection
- orrr3,r7,r6,lsl#20@flags+kernelbase
- /*將目錄內(nèi)空寫到頁表相應(yīng)位置,即((uint32_t*)r4)[pgd_idx]=r3*/
- strr3,[r4,r6,lsl#2]@identitymapping
- /*上面代碼段為[pc&(~0xfffff),(pc+0xfffff)&(~0xfffff)]的物理內(nèi)存空間建立了va=pa的映射關(guān)系。*/
- /*下面為kernel鏡像所占有空間,即KERNL_START到KERNEL_END建立內(nèi)存映射,
- *映射關(guān)系為:va=pa–PHYS+PAGR_OFFSET。注意,這里的KENEL_START是kernel空間開始的虛擬地址。
- *這里的目錄表項同樣是section,即一個項映射1M的內(nèi)存。
- */
- /*KERNEL_START=PAGE_OFFSET+TEXT_OFFSET,
- *r0=((uint32_t*)(r4))[(KERNEL_START&0xff000000)>>20],
- *即r0指向KERNEL_START&0xff000000(即kernel以16M向下對齊的)虛擬地址,所在項表目錄中的位置。
- addr0,r4,#(KERNEL_START&0xff000000)>>18
- /*r0=((uint32_t*)r0)[(KERNEL_START&0x00f00000)>>20]
- *執(zhí)行前r0指向kernel以16M向下對齊的虛執(zhí)地址,而這里再加上KERNEL_START未以16M向?qū)R部分的偏移量。
- *將原來r3的值寫到頁表目錄中。R3的值就是之前已建立好va=pa映射的那個PA值。
- */
- strr3,[r0,#(KERNEL_START&0x00f00000)>>18]!
- /*r6為kernel鏡像的尾部虛擬地址。*/
- ldrr6,=(KERNEL_END-1)
- /*指向下一個即將要填寫的目錄項*/
- addr0,r0,#4
- /*r6指向KERNEL_END-1虛擬地址所在的目錄表項的位置*/
- addr6,r4,r6,lsr#18
- 1:cmpr0,r6
- /*每填一個目錄項,后一個比前一個所指向的物理地址大1M。*/
- addr3,r3,#1<<20
- strlsr3,[r0],#4
- bls1b
- #ifdefCONFIG_XIP_KERNEL
- /*忽略,不分析這種情況*/
- #endif
- /*通常kernel的啟動參數(shù)由bootloader放到了物理內(nèi)存的第1個M上,所以需要為RAM上的第1個M建立映射。
- *上面已為PHYS_OFFSET+TEXT_OFFSET建立了映射,如果TEXT_OFFSET小于0x00100000的話,
- *上面代碼應(yīng)該也為SDRAM的第一個M建立了映射,但如果大于0x0010000則不會。
- *所以這里無論如何均為SDRAM的第一個M建立映射(不知分析對否,還請指正)。
- */
- addr0,r4,#PAGE_OFFSET>>18
- orrr6,r7,#(PHYS_OFFSET&0xff000000)
- .if(PHYS_OFFSET&0x00f00000)
- orrr6,r6,#(PHYS_OFFSET&0x00f00000)
- .endif
- strr6,[r0]
- #ifdefCONFIG_DEBUG_LL
- /*略去*/
- #ifdefined(CONFIG_ARCH_NETWINDER)||defined(CONFIG_ARCH_CATS)
- /*略去*/
- #endif
- #ifdefCONFIG_ARCH_RPC
- /*略去*/
- #endif
- #endif
- movpc,lr
- ENDPROC(__create_page_tables)
- /*
- *Setuptheinitialpagetables.Weonlysetupthebarest
- *amountwhicharerequiredtogetthekernelrunning,which
- *generallymeansmappinginthekernelcode.
- *
- *r8=machinfo
- *r9=cpuid
- *r10=procinfo
- *
- *Returns:
- *r0,r3,r6,r7corrupted
- *r4=physicalpagetableaddress
- */
- __create_page_tables:
- /*r4=KERNEL_RAM_PADDR–0x4000=0x30004000
- *后面的C代碼中的swapper_pg_dir變量,它的值也指向0x30004000
- *內(nèi)存地址,不過它的值是虛擬內(nèi)存地址,即0xc0004000
- */
- pgtblr4@pagetableaddress
- /*將從r4到KERNEL_RAP_PADDR的16K頁表空間清空。*/
- movr0,r4
- movr3,#0
- addr6,r0,#0x4000
- 1:strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- strr3,[r0],#4
- teqr0,r6
- bne1b
- /*還記得r10指向開發(fā)板相應(yīng)的proc_info元素嗎?這里它將的mm_mmuflags值讀到r7中。
- *PROCINFO_MM_MMUFLAGS值為8,可對應(yīng)上面列出來的__arm920_proc_info結(jié)構(gòu)或你相應(yīng)開發(fā)板結(jié)構(gòu)的值來查看該mmu_flags值。
- *這里的flags就是用于設(shè)置目錄項的flags。查看該mmu_flags的定義,發(fā)現(xiàn)它是要求一級頁表是section。
- */
- ldrr7,[r10,#PROCINFO_MM_MMUFLAGS]@mm_mmuflags
- /*
- *CreateidentitymappingforfirstMBofkernelto
- *caterfortheMMUenable.Thisidentitymapping
- *willberemovedbypaging_init().Weuseourcurrentprogram
- *countertodeterminecorrespondingsectionbaseaddress.
- */
- /*r3=((pc>>20)<<20)|r7,即取PC以1M向下對齊的地址。R6=pc>>20也即r6=0x300(pgd_idx),
- *即PC對所有1M內(nèi)存空間,在頁表中的下標(biāo)。
- *R7值表明該目錄項是section,即它映射的大小是1M。故剛好一個目錄項就可以映射kernel上的1M空間。
- *這個暫時的va=pa映射只建立1M大小內(nèi)存的,而不需要建立整個kernel鏡像范圍的映射。
- *因為這個va=pa的映射只有當(dāng)前匯編語言才使用,一量跳進(jìn)start_kernl后,這將不會用到了。而匯編代碼在鏈接時,
- *已將它安排到代碼段的最前面了。
- movr6,pc,lsr#20@startofkernelsection
- orrr3,r7,r6,lsl#20@flags+kernelbase
- /*將目錄內(nèi)空寫到頁表相應(yīng)位置,即((uint32_t*)r4)[pgd_idx]=r3*/
- strr3,[r4,r6,lsl#2]@identitymapping
- /*上面代碼段為[pc&(~0xfffff),(pc+0xfffff)&(~0xfffff)]的物理內(nèi)存空間建立了va=pa的映射關(guān)系。*/
- /*下面為kernel鏡像所占有空間,即KERNL_START到KERNEL_END建立內(nèi)存映射,
- *映射關(guān)系為:va=pa–PHYS+PAGR_OFFSET。注意,這里的KENEL_START是kernel空間開始的虛擬地址。
- *這里的目錄表項同樣是section,即一個項映射1M的內(nèi)存。
- */
- /*KERNEL_START=PAGE_OFFSET+TEXT_OFFSET,
- *r0=((uint32_t*)(r4))[(KERNEL_START&0xff000000)>>20],
- *即r0指向KERNEL_START&0xff000000(即kernel以16M向下對齊的)虛擬地址,所在項表目錄中的位置。
- addr0,r4,#(KERNEL_START&0xff000000)>>18
- /*r0=((uint32_t*)r0)[(KERNEL_START&0x00f00000)>>20]
- *執(zhí)行前r0指向kernel以16M向下對齊的虛執(zhí)地址,而這里再加上KERNEL_START未以16M向?qū)R部分的偏移量。
- *將原來r3的值寫到頁表目錄中。R3的值就是之前已建立好va=pa映射的那個PA值。
- */
- strr3,[r0,#(KERNEL_START&0x00f00000)>>18]!
- /*r6為kernel鏡像的尾部虛擬地址。*/
- ldrr6,=(KERNEL_END-1)
- /*指向下一個即將要填寫的目錄項*/
- addr0,r0,#4
- /*r6指向KERNEL_END-1虛擬地址所在的目錄表項的位置*/
- addr6,r4,r6,lsr#18
- 1:cmpr0,r6
- /*每填一個目錄項,后一個比前一個所指向的物理地址大1M。*/
- addr3,r3,#1<<20
- strlsr3,[r0],#4
- bls1b
- #ifdefCONFIG_XIP_KERNEL
- /*忽略,不分析這種情況*/
- #endif
- /*通常kernel的啟動參數(shù)由bootloader放到了物理內(nèi)存的第1個M上,所以需要為RAM上的第1個M建立映射。
- *上面已為PHYS_OFFSET+TEXT_OFFSET建立了映射,如果TEXT_OFFSET小于0x00100000的話,
- *上面代碼應(yīng)該也為SDRAM的第一個M建立了映射,但如果大于0x0010000則不會。
- *所以這里無論如何均為SDRAM的第一個M建立映射(不知分析對否,還請指正)。
- */
- addr0,r4,#PAGE_OFFSET>>18
- orrr6,r7,#(PHYS_OFFSET&0xff000000)
- .if(PHYS_OFFSET&0x00f00000)
- orrr6,r6,#(PHYS_OFFSET&0x00f00000)
- .endif
- strr6,[r0]
- #ifdefCONFIG_DEBUG_LL
- /*略去*/
- #ifdefined(CONFIG_ARCH_NETWINDER)||defined(CONFIG_ARCH_CATS)
- /*略去*/
- #endif
- #ifdefCONFIG_ARCH_RPC
- /*略去*/
- #endif
- #endif
- movpc,lr
- ENDPROC(__create_page_tables)
一口氣將__create_pages_table分析完,但里涉及的代碼還是需要細(xì)細(xì)品讀。尤其是右移20位和18位兩個地方與頁表目錄項的地址關(guān)系比較復(fù)雜。執(zhí)行完該函數(shù)后,虛擬內(nèi)存和物理內(nèi)存的映射關(guān)系如下圖所示:
6. 開啟MMU
看完頁表的建立,想必開啟MMU的代碼也是小菜一碟吧。此函數(shù)的主要功能是將頁表的基址加到cp15中的面表指針寄存器,同時設(shè)置域訪問(domain access)寄存器。
- /*
- *SetupcommonbitsbeforefinallyenablingtheMMU.Essentially
- *thisisjustloadingthepagetablepointeranddomainaccess
- *registers.
- */
- __enable_mmu:
- /*這里設(shè)置是否為非對齊內(nèi)存訪問產(chǎn)生異常*/
- #ifdefCONFIG_ALIGNMENT_TRAP
- orrr0,r0,#CR_A
- #else
- bicr0,r0,#CR_A
- #endif
- /*是否禁用數(shù)據(jù)緩存功能*/
- #ifdefCONFIG_CPU_DCACHE_DISABLE
- bicr0,r0,#CR_C
- #endif
- /*是否禁用CPU_BPREDICT?,不是很清楚此選項*/
- #ifdefCONFIG_CPU_BPREDICT_DISABLE
- bicr0,r0,#CR_Z
- #endif
- /*是否禁用指令緩存功能*/
- #ifdefCONFIG_CPU_ICACHE_DISABLE
- bicr0,r0,#CR_I
- #endif
- /*設(shè)置域訪問寄存器的值。這里設(shè)置每個domain的屬性是否上面建立的頁表中,
- *每個目錄項的damon值一起進(jìn)行訪問控制檢查。具體情況請參考ARM處理器手冊。
- */
- movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|
- domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|
- domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|
- domain_val(DOMAIN_IO,DOMAIN_CLIENT))
- mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
- mcrp15,0,r4,c2,c0,0@loadpagetablepointer
- b__turn_mmu_on
- ENDPROC(__enable_mmu)
- /*
- *EnabletheMMU.Thiscompletelychangesthestructureofthevisible
- *memoryspace.Youwillnotbeabletotraceexecutionthroughthis.
- *Ifyouhaveanenquiryaboutthis,*please*checkthelinux-arm-kernel
- *mailinglistarchivesBEFOREsendinganotherposttothelist.
- *
- *r0=cp#15controlregister
- *r13=*virtual*addresstojumptouponcompletion
- *
- *otherregistersdependonthefunctioncalleduponcompletion
- */
- .align5
- __turn_mmu_on:
- movr0,r0
- /*將r0的值寫到控制寄存器中。這里,終于開啟MMU功能了。
- *查閱手冊說控制寄存器的0位置1表示開啟MMU,但這里r0的第0是多少呢(還請大家指正)
- */
- mcrp15,0,r0,c1,c0,0@writecontrolreg
- mrcp15,0,r3,c0,c0,0@readidreg
- /*這里的兩個mov似乎是否流水線有關(guān)的,開啟MMU語句后面幾條是不能進(jìn)行內(nèi)存尋址的。但仍未搞明白具體東西的。*/
- movr3,r3
- movr3,r3
- /*轉(zhuǎn)跳到r13的函數(shù)中去,r13為__mmap_switched函數(shù)的虛擬地址,
- *從stext函數(shù)的未尾可以找到它的賦值。故從此開始pc的值就真正在內(nèi)存的虛擬地址空間了。
- */
- movpc,r13
- ENDPROC(__turn_mmu_on)
- /*
- *SetupcommonbitsbeforefinallyenablingtheMMU.Essentially
- *thisisjustloadingthepagetablepointeranddomainaccess
- *registers.
- */
- __enable_mmu:
- /*這里設(shè)置是否為非對齊內(nèi)存訪問產(chǎn)生異常*/
- #ifdefCONFIG_ALIGNMENT_TRAP
- orrr0,r0,#CR_A
- #else
- bicr0,r0,#CR_A
- #endif
- /*是否禁用數(shù)據(jù)緩存功能*/
- #ifdefCONFIG_CPU_DCACHE_DISABLE
- bicr0,r0,#CR_C
- #endif
- /*是否禁用CPU_BPREDICT?,不是很清楚此選項*/
- #ifdefCONFIG_CPU_BPREDICT_DISABLE
- bicr0,r0,#CR_Z
- #endif
- /*是否禁用指令緩存功能*/
- #ifdefCONFIG_CPU_ICACHE_DISABLE
- bicr0,r0,#CR_I
- #endif
- /*設(shè)置域訪問寄存器的值。這里設(shè)置每個domain的屬性是否上面建立的頁表中,
- *每個目錄項的damon值一起進(jìn)行訪問控制檢查。具體情況請參考ARM處理器手冊。
- */
- movr5,#(domain_val(DOMAIN_USER,DOMAIN_MANAGER)|
- domain_val(DOMAIN_KERNEL,DOMAIN_MANAGER)|
- domain_val(DOMAIN_TABLE,DOMAIN_MANAGER)|
- domain_val(DOMAIN_IO,DOMAIN_CLIENT))
- mcrp15,0,r5,c3,c0,0@loaddomainaccessregister
- mcrp15,0,r4,c2,c0,0@loadpagetablepointer
- b__turn_mmu_on
- ENDPROC(__enable_mmu)
- /*
- *EnabletheMMU.Thiscompletelychangesthestructureofthevisible
- *memoryspace.Youwillnotbeabletotraceexecutionthroughthis.
- *Ifyouhaveanenquiryaboutthis,*please*checkthelinux-arm-kernel
- *mailinglistarchivesBEFOREsendinganotherposttothelist.
- *
- *r0=cp#15controlregister
- *r13=*virtual*addresstojumptouponcompletion
- *
- *otherregistersdependonthefunctioncalleduponcompletion
- */
- .align5
- __turn_mmu_on:
- movr0,r0
- /*將r0的值寫到控制寄存器中。這里,終于開啟MMU功能了。
- *查閱手冊說控制寄存器的0位置1表示開啟MMU,但這里r0的第0是多少呢(還請大家指正)
- */
- mcrp15,0,r0,c1,c0,0@writecontrolreg
- mrcp15,0,r3,c0,c0,0@readidreg
- /*這里的兩個mov似乎是否流水線有關(guān)的,開啟MMU語句后面幾條是不能進(jìn)行內(nèi)存尋址的。但仍未搞明白具體東西的。*/
- movr3,r3
- movr3,r3
- /*轉(zhuǎn)跳到r13的函數(shù)中去,r13為__mmap_switched函數(shù)的虛擬地址,
- *從stext函數(shù)的未尾可以找到它的賦值。故從此開始pc的值就真正在內(nèi)存的虛擬地址空間了。
- */
- movpc,r13
- ENDPROC(__turn_mmu_on)
7.__mmap_switched函數(shù)
__mmap_switched函數(shù)專用來設(shè)置C語言的執(zhí)行環(huán)境,比如重定位工作,堆棧,以及BSS段的清零。
__switch_data變量先定義了一系里面處量的數(shù)據(jù),如重定位和數(shù)據(jù)段的地址,BSS段的地址,pocessor_id和__mach_arch_type變量的地址等。
- .type__switch_data,%object
- __switch_data:
- .long__mmap_switched
- .long__data_loc@r4
- .long_data@r5
- .long__bss_start@r6
- .long_end@r7
- .longprocessor_id@r4
- .long__machine_arch_type@r5
- .long__atags_pointer@r6
- .longcr_alignment@r7
- .longinit_thread_union+THREAD_START_SP@sp
- /*
- *ThefollowingfragmentofcodeisexecutedwiththeMMUoninMMUmode,
- *andusesabsoluteaddresses;thisisnotpositionindependent.
- *
- *r0=cp#15controlregister
- *r1=machineID
- *r2=atagspointer
- *r9=processorID
- */
- __mmap_switched:
- adrr3,__switch_data+4
- /*r4=__data_loc,r5=_data,r6=_bss_start,r7=_end*/
- ldmiar3!,{r4,r5,r6,r7}
- /*下面這段代碼類似于這段C代碼,即將整個數(shù)據(jù)段從__data_loc拷貝到_data段。
- *if(__data_loc==_data||_data!=_bass_start)
- *memcpy(_data,__data_loc,_bss_start-_data);
- */
- cmpr4,r5@Copydatasegmentifneeded
- 1:cmpner5,r6
- ldrnefp,[r4],#4
- strnefp,[r5],#4
- bne1b
- /*將BSS段,也即從_bss_start到_end的內(nèi)存清零。*/
- movfp,#0@ClearBSS(andzerofp)
- 1:cmpr6,r7
- strccfp,[r6],#4
- bcc1b
- /*r4=processor_id,
- *r5=__machine_arch_type
- *r6=__atags_pointer
- *r7=cr_alignment
- *sp=init_thread_union+THREAD_START_SP
- *為什么將棧頂指針設(shè)置為init_thread_union+THREAD_START_SP
- *init_head_union變量是一個大小為THREAD_SIZE的union,它在編譯時,放到數(shù)據(jù)段的前面。
- *初步估計這塊空間是內(nèi)核堆棧。故在跳入C語言代碼時,它SP的值設(shè)置為init_thread_union+THREAD_START_SP。
- *注意THREAD_START_SP定義為THREAD_SIZE–8,中間為什么留出8個字節(jié)呢?是與ARM的堆棧操作有關(guān)嗎?還有用專向start_kernel函數(shù)傳遞參數(shù)?
- */
- ldmiar3,{r4,r5,r6,r7,sp}
- strr9,[r4]@SaveprocessorID
- strr1,[r5]@Savemachinetype
- strr2,[r6]@Saveatagspointer
- bicr4,r0,#CR_A@ClearAbit
- /*cr_alignment變量的后面接著放置cr_no_alignment,
- *r0為打開alignment檢測時,控制寄存器的值,而r4為關(guān)閉時的值,
- *這里分將將打開和關(guān)閉alignment檢查的控制寄存器的值寫到
- *cr_alignment和cr_no_alignement變量中。
- */
- stmiar7,{r0,r4}@Savecontrolregistervalues
- /*跳到start_kernel函數(shù),此函數(shù)代碼用純C來實現(xiàn),它會調(diào)用各個平臺的相關(guān)初始化函數(shù),
- *來實現(xiàn)不同平臺的初始化工作。至此,armlinux的啟動工作完成。
- */
- bstart_kernel
- ENDPROC(__mmap_switched)
- .type__switch_data,%object
- __switch_data:
- .long__mmap_switched
- .long__data_loc@r4
- .long_data@r5
- .long__bss_start@r6
- .long_end@r7
- .longprocessor_id@r4
- .long__machine_arch_type@r5
- .long__atags_pointer@r6
- .longcr_alignment@r7
- .longinit_thread_union+THREAD_START_SP@sp
- /*
- *ThefollowingfragmentofcodeisexecutedwiththeMMUoninMMUmode,
- *andusesabsoluteaddresses;thisisnotpositionindependent.
- *
- *r0=cp#15controlregister
- *r1=machineID
- *r2=atagspointer
- *r9=processorID
- */
- __mmap_switched:
- adrr3,__switch_data+4
- /*r4=__data_loc,r5=_data,r6=_bss_start,r7=_end*/
- ldmiar3!,{r4,r5,r6,r7}
- /*下面這段代碼類似于這段C代碼,即將整個數(shù)據(jù)段從__data_loc拷貝到_data段。
- *if(__data_loc==_data||_data!=_bass_start)
- *memcpy(_data,__data_loc,_bss_start-_data);
- */
- cmpr4,r5@Copydatasegmentifneeded
- 1:cmpner5,r6
- ldrnefp,[r4],#4
- strnefp,[r5],#4
- bne1b
- /*將BSS段,也即從_bss_start到_end的內(nèi)存清零。*/
- movfp,#0@ClearBSS(andzerofp)
- 1:cmpr6,r7
- strccfp,[r6],#4
- bcc1b
- /*r4=processor_id,
- *r5=__machine_arch_type
- *r6=__atags_pointer
- *r7=cr_alignment
- *sp=init_thread_union+THREAD_START_SP
- *為什么將棧頂指針設(shè)置為init_thread_union+THREAD_START_SP
- *init_head_union變量是一個大小為THREAD_SIZE的union,它在編譯時,放到數(shù)據(jù)段的前面。
- *初步估計這塊空間是內(nèi)核堆棧。故在跳入C語言代碼時,它SP的值設(shè)置為init_thread_union+THREAD_START_SP。
- *注意THREAD_START_SP定義為THREAD_SIZE–8,中間為什么留出8個字節(jié)呢?是與ARM的堆棧操作有關(guān)嗎?還有用專向start_kernel函數(shù)傳遞參數(shù)?
- */
- ldmiar3,{r4,r5,r6,r7,sp}
- strr9,[r4]@SaveprocessorID
- strr1,[r5]@Savemachinetype
- strr2,[r6]@Saveatagspointer
- bicr4,r0,#CR_A@ClearAbit
- /*cr_alignment變量的后面接著放置cr_no_alignment,
- *r0為打開alignment檢測時,控制寄存器的值,而r4為關(guān)閉時的值,
- *這里分將將打開和關(guān)閉alignment檢查的控制寄存器的值寫到
- *cr_alignment和cr_no_alignement變量中。
- */
- stmiar7,{r0,r4}@Savecontrolregistervalues
- /*跳到start_kernel函數(shù),此函數(shù)代碼用純C來實現(xiàn),它會調(diào)用各個平臺的相關(guān)初始化函數(shù),
- *來實現(xiàn)不同平臺的初始化工作。至此,armlinux的啟動工作完成。
- */
- bstart_kernel
- ENDPROC(__mmap_switched)
評論