Arm Linux系統(tǒng)調用流程詳細解析SWI
Unix系統(tǒng)通過向內核發(fā)出系統(tǒng)調用(system call)實現了用戶態(tài)進程和硬件設備之間的大部分接口。系統(tǒng)調用是操作系統(tǒng)提供的服務,用戶程序通過各種系統(tǒng)調用,來引用內核提供的各種服務,系統(tǒng)調用的執(zhí)行讓用戶程序陷入內核,該陷入動作由swi軟中斷完成。
應用編程接口(API)與系統(tǒng)調用的不同在于,前者只是一個函數定義,說明了如何獲得一個給定的服務,而后者是通過軟件中斷向內核發(fā)出的一個明確的請求。POSIX標準針對API,而不針對系統(tǒng)調用。Unix系統(tǒng)給程序員提供了很多API庫函數。libc的標準c庫所定義的一些API引用了封裝例程(wrapper routine)(其唯一目的就是發(fā)布系統(tǒng)調用)。通常情況下,每個系統(tǒng)調用對應一個封裝例程,而封裝例程定義了應用程序使用的API。反之則不然,一個API沒必要對應一個特定的系統(tǒng)調用。從編程者的觀點看,API和系統(tǒng)調用之間的差別是沒有關系的:唯一相關的事情就是函數名、參數類型及返回代碼的含義。然而,從內核設計者的觀點看,這種差別確實有關系,因為系統(tǒng)調用屬于內核,而用戶態(tài)的庫函數不屬于內核。
大部分封裝例程返回一個整數,其值的含義依賴于相應的系統(tǒng)調用。返回-1通常表示內核不能滿足進程的請求。系統(tǒng)調用處理程序的失敗可能是由無效參數引起的,也可能是因為缺乏可用資源,或硬件出了問題等等。在libd庫中定義的errno變量包含特定的出錯碼。每個出錯碼定義為一個常量宏。
當用戶態(tài)的進程調用一個系統(tǒng)調用時,CPU切換到內核態(tài)并開始執(zhí)行一個內核函數。因為內核實現了很多不同的系統(tǒng)調用,因此進程必須傳遞一個名為系統(tǒng)調用號(system call number)的參數來識別所需的系統(tǒng)調用。所有的系統(tǒng)調用都返回一個整數值。這些返回值與封裝例程返回值的約定是不同的。在內核中,整數或0表示系統(tǒng)調用成功結束,而負數表示一個出錯條件。在后一種情況下,這個值就是存放在errno變量中必須返回給應用程序的負出錯碼。
ARM
SWI{cond} immed_24
其中:
immed_24
使用SWI指令時,通常使用一下兩種方法進行參數傳遞,SWI異常處理程序可以提供相關的服務,這兩種方法均是用戶軟件協(xié)定。SWI異常中斷處理程序要通過讀取引起軟件中斷的SWI指令,以取得24為立即數。
1)、指令中24位的立即數指定了用戶請求的服務類型,參數通過通用寄存器傳遞。如:
MOV R0,#34
SWI 12
2)、指令中的24位立即數被忽略,用戶請求的服務類型有寄存器R0的只決定,參數通過其他的通用寄存器傳遞。如:
MOV R0, #12
MOV R1, #34
SWI 0
在SWI異常處理程序中,去除SWI立即數的步驟為:首先確定一起軟中斷的SWI指令時ARM指令還是Thumb指令,這可通過對SPSR訪問得到;然后取得該SWI指令的地址,這可通過訪問LR寄存器得到;接著讀出指令,分解出立即數(低24位)。
下面的代碼大家可以在entry-common.S中找到。
在2.6.21中,認真研究大家會發(fā)現,你回避不了這樣一個概念,EABI是什么東西?
內核里面談EABI,OABI,其實相對于系統(tǒng)調用的方式,當然我們所說的系統(tǒng)限于arm系統(tǒng)。
EABI (Extended ABI),說的是這樣的一種新的系統(tǒng)調用方式
mov r7, #num
swi 0x0
原來的系統(tǒng)調用方式是這樣,
swi (#num | 0x900000) (0x900000是個magic值)
也就是說原來的調用方式(Old ABI)是通過跟隨在swi指令中的調用號來進行的,現在的是根據r7中的值。
現在看兩個宏,一個是
CONFIG_OABI_COMPAT 意思是說和old ABI兼容
另一個是
CONFIG_AEABI 意思是說指定現在的方式為EABI
這兩個宏可以同時配置,也可以都不配,也可以配置任何一種。
我說一下內核是怎么處理這一問題的。
我們知道,sys_call_table 在內核中是個跳轉表,這個表中存儲的是一系列的函數指針,這些指針就是系統(tǒng)調用函數的指針,如(sys_open).系統(tǒng)調用是根據一個調用號(通常就是表的索引)找到實際該調用內核哪個函數,然后運行該函數完成的。
首先,對于old ABI,內核給出的處理是給它建立一個單獨的system call table,叫sys_oabi_call_table,這樣,兼容方式下就會有兩個system call table, 以old ABI方式的系統(tǒng)調用會執(zhí)行old_syscall_table表中的系統(tǒng)調用函數,EABI方式的系統(tǒng)調用會用sys_call_table中的函數指針。
配置無外乎以下4中
第一 兩個宏都配置 行為就是上面說的那樣
第二 只配置CONFIG_OABI_COMPAT , 那么以old ABI方式調用的會用sys_oabi_call_table,以EABI方式調用的 用sys_call_table,和1實質相同,只是情況1更加明確。
第三 只配置CONFIG_AEABI 系統(tǒng)中不存在 sys_oabi_call_table, 對old ABI方式調用不兼容。只能 以EABI方式調用,用sys_call_table
第四 兩個都沒有配置 系統(tǒng)默認會只允許old ABI方式,但是不存在old_syscall_table,最終會通過sys_call_table 完成函數調用
可以參考下面的代碼
對我們的項目比較有用。
.align 5 ENTRY(vector_swi) sub sp, sp, #S_FRAME_SIZE stmia sp, {r0 - r12} @ Calling r0 - r12 add r8, sp, #S_PC stmdb r8, {sp, lr}^ @ Calling sp, lr mrs r8, spsr @ called from non-FIQ mode, so ok. str lr, [sp, #S_PC] @ Save calling PC str r8, [sp, #S_PSR] @ Save CPSR str r0, [sp, #S_OLD_R0] @ Save OLD_R0 zero_fp /* * Get the system call number. */ #if defined(CONFIG_OABI_COMPAT) /* * If we have CONFIG_OABI_COMPAT then we need to look at the swi * value to determine if it is an EABI or an old ABI call. */ #ifdef CONFIG_ARM_THUMB tst r8, #PSR_T_BIT movne r10, #0 @ no thumb OABI emulation ldreq r10, [lr, #-4] @ get SWI instruction #else ldr r10, [lr, #-4] @ get SWI instruction A710( and ip, r10, #0x0f000000 @ check for SWI ) A710( teq ip, #0x0f000000 ) A710( bne .Larm710bug ) #endif #elif defined(CONFIG_AEABI) /* * Pure EABI user space always put syscall number into scno (r7). */ A710( ldr ip, [lr, #-4] @ get SWI instruction ) A710( and ip, ip, #0x0f000000 @ check for SWI ) A710( teq ip, #0x0f000000 ) A710( bne .Larm710bug ) #elif defined(CONFIG_ARM_THUMB) /* Legacy ABI only, possibly thumb mode. */ tst r8, #PSR_T_BIT @ this is SPSR from save_user_regs addne scno, r7, #__NR_SYSCALL_BASE @ put OS number in ldreq scno, [lr, #-4] #else /* Legacy ABI only. */ ldr scno, [lr, #-4] @ get SWI instruction A710( and ip, scno, #0x0f000000 @ check for SWI ) A710( teq ip, #0x0f000000 ) A710( bne .Larm710bug ) #endif #ifdef CONFIG_ALIGNMENT_TRAP ldr ip, __cr_alignment ldr ip, [ip] mcr p15, 0, ip, c1, c0 @ update control register #endif enable_irq get_thread_info tsk adr tbl, sys_call_table @ load syscall table pointer ldr ip, [tsk, #TI_FLAGS] @ check for syscall tracing #if defined(CONFIG_OABI_COMPAT) /* * If the swi argument is zero, this is an EABI call and we do nothing. * * If this is an old ABI call, get the syscall number into scno and * get the old ABI syscall table address. */ bics r10, r10, #0xff000000 eorne scno, r10, #__NR_OABI_SYSCALL_BASE ldrne tbl, =sys_oabi_call_table #elif !defined(CONFIG_AEABI) bic scno, scno, #0xff000000 @ mask off SWI op-code eor scno, scno, #__NR_SYSCALL_BASE @ check OS number #endif stmdb sp!, {r4, r5} @ push fifth and sixth args tst ip, #_TIF_SYSCALL_TRACE @ are we tracing syscalls? bne __sys_trace cmp scno, #NR_syscalls @ check upper syscall limit adr lr, ret_fast_syscall @ return address ldrcc pc, [tbl, scno, lsl #2] @ call sys_* routine add r1, sp, #S_OFF 2: mov why, #0 @ no longer a real syscall cmp scno, #(__ARM_NR_BASE - __NR_SYSCALL_BASE) eor r0, scno, #__NR_SYSCALL_BASE @ put OS number back bcs arm_syscall b sys_ni_syscall @ not private func /* * This is the really slow path. Were going to be doing * context switches, and waiting for our parent to respond. */ __sys_trace: mov r2, scno add r1, sp, #S_OFF mov r0, #0 @ trace entry [IP = 0] bl syscall_trace adr lr, __sys_trace_return @ return address mov scno, r0 @ syscall number (possibly new) add r1, sp, #S_R0 + S_OFF @ pointer to regs cmp scno, #NR_syscalls @ check upper syscall limit ldmccia r1, {r0 - r3} @ have to reload r0 - r3 ldrcc pc, [tbl, scno, lsl #2] @ call sys_* routine
系統(tǒng)調用是os操作系統(tǒng)提供的服務,用戶程序通過各種系統(tǒng)調用,來引用內核提供的各種服務,系統(tǒng)調用的執(zhí)行讓用戶程序陷入內核,該陷入動作由swi軟中斷完成.
At91rm9200處理器對應的linux2.4.19內核系統(tǒng)調用對應的軟中斷定義如下:
#if defined(__thumb__) //thumb模式#define __syscall(name) "push {r7}nt" "mov r7, #" __sys1(__NR_##name) "nt" "swi 0nt" "pop {r7}"#else //arm模式#define __syscall(name) "swit" __sys1(__NR_##name) "nt"#endif#define __sys2(x) #x#define __sys1(x) __sys2(x)#define __NR_SYSCALL_BASE 0x900000 //此為OS_NUMBER << 20運算值#define __NR_open (__NR_SYSCALL_BASE+ 5) //0x900005
舉一個例子來說:open系統(tǒng)調用,庫函數最終會調用__syscall(open),宏展開之后為swi #__NR_open,即,swi #0x900005觸發(fā)中斷,中斷號0x900005存放在[lr,#-4]地址中,處理器跳轉到arch/arm/kernel/entry-common.S中vector_swi讀取[lr,#-4]地址中的中斷號,之后查詢arch/arm/kernel/entry-common.S中的sys_call_table系統(tǒng)調用表,該表內容在arch/arm/kernel/calls.S中定義,__NR_open在表中對應的順序號為
__syscall_start:
.long SYMBOL_NAME(sys_open) //第5個...將sys_call_table[5]中內容傳給pc,系統(tǒng)進入sys_open函數,處理實質的open動作注:用到的一些函數數據所在文件,如下所示arch/arm/kernel/calls.S聲明了系統(tǒng)調用函數include/asm-arm/unistd.h定義了系統(tǒng)調用的調用號規(guī)則vector_swi定義在arch/arm/kernel/entry-common.Svector_IRQ定義在arch/arm/kernel/entry-armv.Svector_FIQ定義在arch/arm/kernel/entry-armv.Sarch/arm/kernel/entry-common.S中對sys_call_table進行了定義:.type sys_call_table, #objectENTRY(sys_call_table)#include "calls.S" //將calls.S中的內容順序鏈接到這里
源程序:
ENTRY(vector_swi)save_user_regszero_fpget_scno //將[lr,#-4]中的中斷號轉儲到scno(r7)arm710_bug_check scno, ip#ifdef CONFIG_ALIGNMENT_TRAPldr ip, __cr_alignmentldr ip, [ip]mcr p15, 0, ip, c1, c0 @ update control register#endifenable_irq ipstr r4, [sp, #-S_OFF]! @ push fifth argget_current_task tskldr ip, [tsk, #TSK_PTRACE] @ check for syscall tracingbic scno, scno, #0xff000000 @ mask off SWI op-code//#define OS_NUMBER 9[entry-header.S]//所以對于上面示例中open系統(tǒng)調用號scno=0x900005//eor scno,scno,#0x900000//之后scno=0x05eor scno, scno, #OS_NUMBER << 20 @ check OS number//sys_call_table項為calls.S的內容adr tbl, sys_call_table @ load syscall table pointertst ip, #PT_TRACESYS @ are we tracing syscalls?bne __sys_traceadrsvc al, lr, ret_fast_syscall @ return addresscmp scno, #NR_syscalls @ check upper syscall limit//執(zhí)行sys_open函數ldrcc pc, [tbl, scno, lsl #2] @ call sys_* routineadd r1, sp, #S_OFF2: mov why, #0 @ no longer a real syscallcmp scno, #ARMSWI_OFFSETeor r0, scno, #OS_NUMBER << 20 @ put OS number backbcs SYMBOL_NAME(arm_syscall) b SYMBOL_NAME(sys_ni_syscall) @ not private func/** This is the really slow path. Were going to be doing* context switches, and waiting for our parent to respond.*/__sys_trace:add r1, sp, #S_OFFmov r0, #0 @ trace entry [IP = 0]bl SYMBOL_NAME(syscall_trace)/*//2007-07-01 gliethttp [entry-header.S]//Like adr, but force SVC mode (if required).macro adrsvc, cond, reg, labeladrcond reg, label.endm//對應反匯編://add lr, pc, #16 ; lr = __sys_trace_return*/adrsvc al, lr, __sys_trace_return @ return addressadd r1, sp, #S_R0 + S_OFF @ pointer to regscmp scno, #NR_syscalls @ check upper syscall limitldmccia r1, {r0 - r3} @ have to reload r0 - r3ldrcc pc, [tbl, scno, lsl #2] @ call sys_* routineb 2b__sys_trace_return:str r0, [sp, #S_R0 + S_OFF]! @ save returned r0mov r1, spmov r0, #1 @ trace exit [IP = 1]bl SYMBOL_NAME(syscall_trace)b ret_disable_irq.align 5#ifdef CONFIG_ALIGNMENT_TRAP.type __cr_alignment, #object__cr_alignment:.word SYMBOL_NAME(cr_alignment)#endif.type sys_call_table, #objectENTRY(sys_call_table)#include "calls.S"
評論