新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > Arm Linux系統(tǒng)調(diào)用流程詳細(xì)解析SWI

Arm Linux系統(tǒng)調(diào)用流程詳細(xì)解析SWI

作者: 時(shí)間:2016-11-09 來(lái)源:網(wǎng)絡(luò) 收藏

本文引用地址:http://m.butianyuan.cn/article/201611/318012.htm

Unix系統(tǒng)通過(guò)向內(nèi)核發(fā)出系統(tǒng)調(diào)用(system call)實(shí)現(xiàn)了用戶(hù)態(tài)進(jìn)程和硬件設(shè)備之間的大部分接口。系統(tǒng)調(diào)用是操作系統(tǒng)提供的服務(wù),用戶(hù)程序通過(guò)各種系統(tǒng)調(diào)用,來(lái)引用內(nèi)核提供的各種服務(wù),系統(tǒng)調(diào)用的執(zhí)行讓用戶(hù)程序陷入內(nèi)核,該陷入動(dòng)作由swi軟中斷完成。

應(yīng)用編程接口(API)與系統(tǒng)調(diào)用的不同在于,前者只是一個(gè)函數(shù)定義,說(shuō)明了如何獲得一個(gè)給定的服務(wù),而后者是通過(guò)軟件中斷向內(nèi)核發(fā)出的一個(gè)明確的請(qǐng)求。POSIX標(biāo)準(zhǔn)針對(duì)API,而不針對(duì)系統(tǒng)調(diào)用。Unix系統(tǒng)給程序員提供了很多API庫(kù)函數(shù)。libc的標(biāo)準(zhǔn)c庫(kù)所定義的一些API引用了封裝例程(wrapper routine)(其唯一目的就是發(fā)布系統(tǒng)調(diào)用)。通常情況下,每個(gè)系統(tǒng)調(diào)用對(duì)應(yīng)一個(gè)封裝例程,而封裝例程定義了應(yīng)用程序使用的API。反之則不然,一個(gè)API沒(méi)必要對(duì)應(yīng)一個(gè)特定的系統(tǒng)調(diào)用。從編程者的觀點(diǎn)看,API和系統(tǒng)調(diào)用之間的差別是沒(méi)有關(guān)系的:唯一相關(guān)的事情就是函數(shù)名、參數(shù)類(lèi)型及返回代碼的含義。然而,從內(nèi)核設(shè)計(jì)者的觀點(diǎn)看,這種差別確實(shí)有關(guān)系,因?yàn)橄到y(tǒng)調(diào)用屬于內(nèi)核,而用戶(hù)態(tài)的庫(kù)函數(shù)不屬于內(nèi)核。

大部分封裝例程返回一個(gè)整數(shù),其值的含義依賴(lài)于相應(yīng)的系統(tǒng)調(diào)用。返回-1通常表示內(nèi)核不能滿足進(jìn)程的請(qǐng)求。系統(tǒng)調(diào)用處理程序的失敗可能是由無(wú)效參數(shù)引起的,也可能是因?yàn)槿狈捎觅Y源,或硬件出了問(wèn)題等等。在libd庫(kù)中定義的errno變量包含特定的出錯(cuò)碼。每個(gè)出錯(cuò)碼定義為一個(gè)常量宏。

當(dāng)用戶(hù)態(tài)的進(jìn)程調(diào)用一個(gè)系統(tǒng)調(diào)用時(shí),CPU切換到內(nèi)核態(tài)并開(kāi)始執(zhí)行一個(gè)內(nèi)核函數(shù)。因?yàn)閮?nèi)核實(shí)現(xiàn)了很多不同的系統(tǒng)調(diào)用,因此進(jìn)程必須傳遞一個(gè)名為系統(tǒng)調(diào)用號(hào)(system call number)的參數(shù)來(lái)識(shí)別所需的系統(tǒng)調(diào)用。所有的系統(tǒng)調(diào)用都返回一個(gè)整數(shù)值。這些返回值與封裝例程返回值的約定是不同的。在內(nèi)核中,整數(shù)或0表示系統(tǒng)調(diào)用成功結(jié)束,而負(fù)數(shù)表示一個(gè)出錯(cuò)條件。在后一種情況下,這個(gè)值就是存放在errno變量中必須返回給應(yīng)用程序的負(fù)出錯(cuò)碼。

ARMLinux系統(tǒng)利用SWI指令來(lái)從用戶(hù)空間進(jìn)入內(nèi)核空間,還是先讓我們了解下這個(gè)SWI指令吧。SWI指令用于產(chǎn)生軟件中斷,從而實(shí)現(xiàn)從用戶(hù)模式變換到管理模式,CPSR保存到管理模式的SPSR,執(zhí)行轉(zhuǎn)移到SWI向量。在其他模式下也可使用SWI指令,處理器同樣地切換到管理模式。指令格式如下:

SWI{cond} immed_24

其中:

immed_2424位立即數(shù),值為從0――16777215之間的整數(shù)。

使用SWI指令時(shí),通常使用一下兩種方法進(jìn)行參數(shù)傳遞,SWI異常處理程序可以提供相關(guān)的服務(wù),這兩種方法均是用戶(hù)軟件協(xié)定。SWI異常中斷處理程序要通過(guò)讀取引起軟件中斷的SWI指令,以取得24為立即數(shù)。

1)、指令中24位的立即數(shù)指定了用戶(hù)請(qǐng)求的服務(wù)類(lèi)型,參數(shù)通過(guò)通用寄存器傳遞。如:

MOV R0,#34

SWI 12

2)、指令中的24位立即數(shù)被忽略,用戶(hù)請(qǐng)求的服務(wù)類(lèi)型有寄存器R0的只決定,參數(shù)通過(guò)其他的通用寄存器傳遞。如:

MOV R0, #12

MOV R1, #34

SWI 0

在SWI異常處理程序中,去除SWI立即數(shù)的步驟為:首先確定一起軟中斷的SWI指令時(shí)ARM指令還是Thumb指令,這可通過(guò)對(duì)SPSR訪問(wèn)得到;然后取得該SWI指令的地址,這可通過(guò)訪問(wèn)LR寄存器得到;接著讀出指令,分解出立即數(shù)(低24位)。

下面的代碼大家可以在entry-common.S中找到。

在2.6.21中,認(rèn)真研究大家會(huì)發(fā)現(xiàn),你回避不了這樣一個(gè)概念,EABI是什么東西?

內(nèi)核里面談EABI,OABI,其實(shí)相對(duì)于系統(tǒng)調(diào)用的方式,當(dāng)然我們所說(shuō)的系統(tǒng)限于arm系統(tǒng)。
EABI (Extended ABI),說(shuō)的是這樣的一種新的系統(tǒng)調(diào)用方式

mov r7, #num
swi 0x0

原來(lái)的系統(tǒng)調(diào)用方式是這樣,
swi (#num | 0x900000) (0x900000是個(gè)magic值)

也就是說(shuō)原來(lái)的調(diào)用方式(Old ABI)是通過(guò)跟隨在swi指令中的調(diào)用號(hào)來(lái)進(jìn)行的,現(xiàn)在的是根據(jù)r7中的值。

現(xiàn)在看兩個(gè)宏,一個(gè)是
CONFIG_OABI_COMPAT 意思是說(shuō)和old ABI兼容

另一個(gè)是
CONFIG_AEABI 意思是說(shuō)指定現(xiàn)在的方式為EABI

這兩個(gè)宏可以同時(shí)配置,也可以都不配,也可以配置任何一種。

我說(shuō)一下內(nèi)核是怎么處理這一問(wèn)題的。
我們知道,sys_call_table 在內(nèi)核中是個(gè)跳轉(zhuǎn)表,這個(gè)表中存儲(chǔ)的是一系列的函數(shù)指針,這些指針就是系統(tǒng)調(diào)用函數(shù)的指針,如(sys_open).系統(tǒng)調(diào)用是根據(jù)一個(gè)調(diào)用號(hào)(通常就是表的索引)找到實(shí)際該調(diào)用內(nèi)核哪個(gè)函數(shù),然后運(yùn)行該函數(shù)完成的。

首先,對(duì)于old ABI,內(nèi)核給出的處理是給它建立一個(gè)單獨(dú)的system call table,叫sys_oabi_call_table,這樣,兼容方式下就會(huì)有兩個(gè)system call table, 以old ABI方式的系統(tǒng)調(diào)用會(huì)執(zhí)行old_syscall_table表中的系統(tǒng)調(diào)用函數(shù),EABI方式的系統(tǒng)調(diào)用會(huì)用sys_call_table中的函數(shù)指針。

配置無(wú)外乎以下4中

第一 兩個(gè)宏都配置 行為就是上面說(shuō)的那樣

第二 只配置CONFIG_OABI_COMPAT , 那么以old ABI方式調(diào)用的會(huì)用sys_oabi_call_table,以EABI方式調(diào)用的 用sys_call_table,和1實(shí)質(zhì)相同,只是情況1更加明確。

第三 只配置CONFIG_AEABI 系統(tǒng)中不存在 sys_oabi_call_table, 對(duì)old ABI方式調(diào)用不兼容。只能 以EABI方式調(diào)用,用sys_call_table

第四 兩個(gè)都沒(méi)有配置 系統(tǒng)默認(rèn)會(huì)只允許old ABI方式,但是不存在old_syscall_table,最終會(huì)通過(guò)sys_call_table 完成函數(shù)調(diào)用

可以參考下面的代碼
對(duì)我們的項(xiàng)目比較有用。

.align 5 ENTRY(vector_swi) sub sp, sp, #S_FRAME_SIZE stmia sp, {r0 - r12} @ Calling r0 - r12 add r8, sp, #S_PC stmdb r8, {sp, lr}^ @ Calling sp, lr mrs r8, spsr @ called from non-FIQ mode, so ok. str lr, [sp, #S_PC] @ Save calling PC str r8, [sp, #S_PSR] @ Save CPSR str r0, [sp, #S_OLD_R0] @ Save OLD_R0 zero_fp /* * Get the system call number. */ #if defined(CONFIG_OABI_COMPAT) /* * If we have CONFIG_OABI_COMPAT then we need to look at the swi * value to determine if it is an EABI or an old ABI call. */ #ifdef CONFIG_ARM_THUMB tst r8, #PSR_T_BIT movne r10, #0 @ no thumb OABI emulation ldreq r10, [lr, #-4] @ get SWI instruction #else ldr r10, [lr, #-4] @ get SWI instruction A710( and ip, r10, #0x0f000000 @ check for SWI ) A710( teq ip, #0x0f000000 ) A710( bne .Larm710bug ) #endif #elif defined(CONFIG_AEABI) /* * Pure EABI user space always put syscall number into scno (r7). */ A710( ldr ip, [lr, #-4] @ get SWI instruction ) A710( and ip, ip, #0x0f000000 @ check for SWI ) A710( teq ip, #0x0f000000 ) A710( bne .Larm710bug ) #elif defined(CONFIG_ARM_THUMB) /* Legacy ABI only, possibly thumb mode. */ tst r8, #PSR_T_BIT @ this is SPSR from save_user_regs addne scno, r7, #__NR_SYSCALL_BASE @ put OS number in ldreq scno, [lr, #-4] #else /* Legacy ABI only. */ ldr scno, [lr, #-4] @ get SWI instruction A710( and ip, scno, #0x0f000000 @ check for SWI ) A710( teq ip, #0x0f000000 ) A710( bne .Larm710bug ) #endif #ifdef CONFIG_ALIGNMENT_TRAP ldr ip, __cr_alignment ldr ip, [ip] mcr p15, 0, ip, c1, c0 @ update control register #endif enable_irq get_thread_info tsk adr tbl, sys_call_table @ load syscall table pointer ldr ip, [tsk, #TI_FLAGS] @ check for syscall tracing #if defined(CONFIG_OABI_COMPAT) /* * If the swi argument is zero, this is an EABI call and we do nothing. * * If this is an old ABI call, get the syscall number into scno and * get the old ABI syscall table address. */ bics r10, r10, #0xff000000 eorne scno, r10, #__NR_OABI_SYSCALL_BASE ldrne tbl, =sys_oabi_call_table #elif !defined(CONFIG_AEABI) bic scno, scno, #0xff000000 @ mask off SWI op-code eor scno, scno, #__NR_SYSCALL_BASE @ check OS number #endif stmdb sp!, {r4, r5} @ push fifth and sixth args tst ip, #_TIF_SYSCALL_TRACE @ are we tracing syscalls? bne __sys_trace cmp scno, #NR_syscalls @ check upper syscall limit adr lr, ret_fast_syscall @ return address ldrcc pc, [tbl, scno, lsl #2] @ call sys_* routine add r1, sp, #S_OFF 2: mov why, #0 @ no longer a real syscall cmp scno, #(__ARM_NR_BASE - __NR_SYSCALL_BASE) eor r0, scno, #__NR_SYSCALL_BASE @ put OS number back bcs arm_syscall b sys_ni_syscall @ not private func /* * This is the really slow path. Were going to be doing * context switches, and waiting for our parent to respond. */ __sys_trace: mov r2, scno add r1, sp, #S_OFF mov r0, #0 @ trace entry [IP = 0] bl syscall_trace adr lr, __sys_trace_return @ return address mov scno, r0 @ syscall number (possibly new) add r1, sp, #S_R0 + S_OFF @ pointer to regs cmp scno, #NR_syscalls @ check upper syscall limit ldmccia r1, {r0 - r3} @ have to reload r0 - r3 ldrcc pc, [tbl, scno, lsl #2] @ call sys_* routine 

系統(tǒng)調(diào)用是os操作系統(tǒng)提供的服務(wù),用戶(hù)程序通過(guò)各種系統(tǒng)調(diào)用,來(lái)引用內(nèi)核提供的各種服務(wù),系統(tǒng)調(diào)用的執(zhí)行讓用戶(hù)程序陷入內(nèi)核,該陷入動(dòng)作由swi軟中斷完成.

At91rm9200處理器對(duì)應(yīng)的linux2.4.19內(nèi)核系統(tǒng)調(diào)用對(duì)應(yīng)的軟中斷定義如下:

#if defined(__thumb__)                             //thumb模式#define __syscall(name)                          "push    {r7}nt"                           "mov    r7, #" __sys1(__NR_##name) "nt"    "swi    0nt"                               "pop    {r7}"#else                                              //arm模式#define __syscall(name) "swit" __sys1(__NR_##name) "nt"#endif#define __sys2(x) #x#define __sys1(x) __sys2(x)#define __NR_SYSCALL_BASE    0x900000               //此為OS_NUMBER << 20運(yùn)算值#define __NR_open            (__NR_SYSCALL_BASE+ 5) //0x900005 


舉一個(gè)例子來(lái)說(shuō):open系統(tǒng)調(diào)用,庫(kù)函數(shù)最終會(huì)調(diào)用__syscall(open),宏展開(kāi)之后為swi #__NR_open,即,swi #0x900005觸發(fā)中斷,中斷號(hào)0x900005存放在[lr,#-4]地址中,處理器跳轉(zhuǎn)到arch/arm/kernel/entry-common.S中vector_swi讀取[lr,#-4]地址中的中斷號(hào),之后查詢(xún)arch/arm/kernel/entry-common.S中的sys_call_table系統(tǒng)調(diào)用表,該表內(nèi)容在arch/arm/kernel/calls.S中定義,__NR_open在表中對(duì)應(yīng)的順序號(hào)為

__syscall_start:

.long    SYMBOL_NAME(sys_open)                     //第5個(gè)...將sys_call_table[5]中內(nèi)容傳給pc,系統(tǒng)進(jìn)入sys_open函數(shù),處理實(shí)質(zhì)的open動(dòng)作注:用到的一些函數(shù)數(shù)據(jù)所在文件,如下所示arch/arm/kernel/calls.S聲明了系統(tǒng)調(diào)用函數(shù)include/asm-arm/unistd.h定義了系統(tǒng)調(diào)用的調(diào)用號(hào)規(guī)則vector_swi定義在arch/arm/kernel/entry-common.Svector_IRQ定義在arch/arm/kernel/entry-armv.Svector_FIQ定義在arch/arm/kernel/entry-armv.Sarch/arm/kernel/entry-common.S中對(duì)sys_call_table進(jìn)行了定義:.type    sys_call_table, #objectENTRY(sys_call_table)#include "calls.S"                                 //將calls.S中的內(nèi)容順序鏈接到這里

源程序:

ENTRY(vector_swi)save_user_regszero_fpget_scno                                        //將[lr,#-4]中的中斷號(hào)轉(zhuǎn)儲(chǔ)到scno(r7)arm710_bug_check scno, ip#ifdef CONFIG_ALIGNMENT_TRAPldr    ip, __cr_alignmentldr    ip, [ip]mcr    p15, 0, ip, c1, c0                       @ update control register#endifenable_irq ipstr    r4, [sp, #-S_OFF]!                       @ push fifth argget_current_task tskldr    ip, [tsk, #TSK_PTRACE]                   @ check for syscall tracingbic    scno, scno, #0xff000000                  @ mask off SWI op-code//#define OS_NUMBER    9[entry-header.S]//所以對(duì)于上面示例中open系統(tǒng)調(diào)用號(hào)scno=0x900005//eor scno,scno,#0x900000//之后scno=0x05eor    scno, scno, #OS_NUMBER << 20             @ check OS number//sys_call_table項(xiàng)為calls.S的內(nèi)容adr    tbl, sys_call_table                      @ load syscall table pointertst    ip, #PT_TRACESYS                         @ are we tracing syscalls?bne    __sys_traceadrsvc    al, lr, ret_fast_syscall              @ return addresscmp    scno, #NR_syscalls                       @ check upper syscall limit//執(zhí)行sys_open函數(shù)ldrcc    pc, [tbl, scno, lsl #2]                @ call sys_* routineadd    r1, sp, #S_OFF2:  mov    why, #0                                  @ no longer a real syscallcmp    scno, #ARMSWI_OFFSETeor    r0, scno, #OS_NUMBER << 20               @ put OS number backbcs    SYMBOL_NAME(arm_syscall)    b    SYMBOL_NAME(sys_ni_syscall)                @ not private func/** This is the really slow path. Were going to be doing* context switches, and waiting for our parent to respond.*/__sys_trace:add    r1, sp, #S_OFFmov    r0, #0                                   @ trace entry [IP = 0]bl    SYMBOL_NAME(syscall_trace)/*//2007-07-01 gliethttp [entry-header.S]//Like adr, but force SVC mode (if required).macro adrsvc, cond, reg, labeladrcond reg, label.endm//對(duì)應(yīng)反匯編://add lr, pc, #16 ; lr = __sys_trace_return*/adrsvc    al, lr, __sys_trace_return            @ return addressadd    r1, sp, #S_R0 + S_OFF                    @ pointer to regscmp    scno, #NR_syscalls                       @ check upper syscall limitldmccia    r1, {r0 - r3}                        @ have to reload r0 - r3ldrcc    pc, [tbl, scno, lsl #2]                @ call sys_* routineb    2b__sys_trace_return:str    r0, [sp, #S_R0 + S_OFF]!                 @ save returned r0mov    r1, spmov    r0, #1                                   @ trace exit [IP = 1]bl    SYMBOL_NAME(syscall_trace)b    ret_disable_irq.align    5#ifdef CONFIG_ALIGNMENT_TRAP.type    __cr_alignment, #object__cr_alignment:.word    SYMBOL_NAME(cr_alignment)#endif.type    sys_call_table, #objectENTRY(sys_call_table)#include "calls.S"


評(píng)論


技術(shù)專(zhuān)區(qū)

關(guān)閉