為何C語(yǔ)言函數(shù)調(diào)用要堆棧,而匯編卻不需要?
最近,看了很多關(guān)于uboot的分析,其中就有說(shuō)要為C語(yǔ)言的運(yùn)行,就要準(zhǔn)備好堆棧。而在Uboot的start.S匯編代碼中,關(guān)于系統(tǒng)初始化,也看到有堆棧指針初始化這個(gè)動(dòng)作。但是,從來(lái)只是看到有人說(shuō)系統(tǒng)初始化要初始化堆棧,即正確給堆棧指針sp賦值,但是卻從來(lái)沒(méi)有看到有人解釋,為何要初始化堆棧。
本文引用地址:http://m.butianyuan.cn/article/201807/384661.htm今天,我們就來(lái)試圖解釋一下,為何要初始化堆棧,即:
為何C語(yǔ)言的函數(shù)調(diào)用要用到堆棧,而匯編卻不需要初始化堆棧?
要明白這個(gè)問(wèn)題,首先要了解堆棧的作用。
關(guān)于堆棧的作用,要詳細(xì)講解的話,要很長(zhǎng)的篇幅,所以此處只是做簡(jiǎn)略介紹。
總的來(lái)說(shuō),堆棧的作用就是:保存現(xiàn)場(chǎng)/上下文,傳遞參數(shù)。
1
保存現(xiàn)場(chǎng)/上下文
現(xiàn)場(chǎng),意思就相當(dāng)于案發(fā)現(xiàn)場(chǎng),總有一些現(xiàn)場(chǎng)的情況,要記錄下來(lái)的,否則被別人破壞掉之后,你就無(wú)法恢復(fù)現(xiàn)場(chǎng)了。而此處說(shuō)的現(xiàn)場(chǎng),就是指CPU運(yùn)行的時(shí)候,用到了一些寄存器,比如r0,r1等等,對(duì)于這些寄存器的值,如果你不保存而直接跳轉(zhuǎn)到子函數(shù)中去執(zhí)行,那么很可能就被其破壞了,因?yàn)槠浜瘮?shù)執(zhí)行也要用到這些寄存器。
因此,在函數(shù)調(diào)用之前,應(yīng)該將這些寄存器等現(xiàn)場(chǎng),暫時(shí)保持起來(lái),等調(diào)用函數(shù)執(zhí)行完畢返回后,再恢復(fù)現(xiàn)場(chǎng)。這樣CPU就可以正確的繼續(xù)執(zhí)行了。
在計(jì)算機(jī)中,你??梢钥吹缴舷挛倪@個(gè)詞,對(duì)應(yīng)的英文是context。那么:
1.1.什么叫做上下文context
保存現(xiàn)場(chǎng),也叫保存上下文。
上下文,英文叫做context,就是上面的文章,和下面的文章,即與你此刻,當(dāng)前CPU運(yùn)行有關(guān)系的內(nèi)容,即那些你用到寄存器。所以,和上面的現(xiàn)場(chǎng),是一個(gè)意思。
保存寄存器的值,一般用的是push指令,將對(duì)應(yīng)的某些寄存器的值,一個(gè)個(gè)放到堆棧中,把對(duì)應(yīng)的值壓入到堆棧里面,即所謂的壓棧。
然后待被調(diào)用的子函數(shù)執(zhí)行完畢的時(shí)候,再調(diào)用pop,把堆棧中的一個(gè)個(gè)的值,賦值給對(duì)應(yīng)的那些你剛開始?jí)簵r(shí)用到的寄存器,把對(duì)應(yīng)的值從堆棧中彈出去,即所謂的出棧。
其中保存的寄存器中,也包括lr的值(因?yàn)橛胋l指令進(jìn)行跳轉(zhuǎn)的話,那么之前的pc的值是存在lr中的),然后在子程序執(zhí)行完畢的時(shí)候,再把堆棧中的lr的值pop出來(lái),賦值給pc,這樣就實(shí)現(xiàn)了子函數(shù)的正確的返回。
2
傳遞參數(shù)
C語(yǔ)言進(jìn)行函數(shù)調(diào)用的時(shí)候,常常會(huì)傳遞給被調(diào)用的函數(shù)一些參數(shù),對(duì)于這些C語(yǔ)言級(jí)別的參數(shù),被編譯器翻譯成匯編語(yǔ)言的時(shí)候,就要找個(gè)地方存放一下,并且讓被調(diào)用的函數(shù)能夠訪問(wèn),否則就沒(méi)發(fā)實(shí)現(xiàn)傳遞參數(shù)了。對(duì)于找個(gè)地方放一下,分兩種情況。
一種情況是,本身傳遞的參數(shù)就很少,就可以通過(guò)寄存器傳送參數(shù)。
因?yàn)樵谇懊娴谋4娆F(xiàn)場(chǎng)的動(dòng)作中,已經(jīng)保存好了對(duì)應(yīng)的寄存器的值,那么此時(shí),這些寄存器就是空閑的,可以供我們使用的了,那就可以放參數(shù),而參數(shù)少的情況下,就足夠存放參數(shù)了,比如參數(shù)有2個(gè),那么就用r0和r1存放即可。(關(guān)于參數(shù)1和參數(shù)2,具體哪個(gè)放在r0,哪個(gè)放在r1,就是和APCS中的“在函數(shù)調(diào)用之間傳遞/返回參數(shù)”相關(guān)了,APCS中會(huì)有詳細(xì)的約定。感興趣的自己去研究。)
但是如果參數(shù)太多,寄存器不夠用,那么就得把多余的參數(shù)堆棧中了。
即,可以用堆棧來(lái)傳遞所有的或寄存器放不下的那些多余的參數(shù)。
3
舉例分析C語(yǔ)言函數(shù)調(diào)用是如何使用堆棧的
對(duì)于上面的解釋的堆棧的作用顯得有些抽象,此處再用例子來(lái)簡(jiǎn)單說(shuō)明一下,就容易明白了:
用:
1. arm-inux-objdump –d u-boot > dump_u-boot.txt
可以得到dump_u-boot.txt文件。該文件就是中,包含了u-boot中的程序的可執(zhí)行的匯編代碼,其中我們可以看到C語(yǔ)言的函數(shù)的源代碼,到底對(duì)應(yīng)著那些匯編代碼。
下面貼出兩個(gè)函數(shù)的匯編代碼,
一個(gè)是clock_init,
另一個(gè)是與clock_init在同一C源文件中的,另外一個(gè)函數(shù)CopyCode2Ram:
1. 33d0091c :
2. 33d0091c: e92d4070 push {r4, r5, r6, lr}
3. 33d00920: e1a06000 mov r6, r0
4. 33d00924: e1a05001 mov r5, r1
5. 33d00928: e1a04002 mov r4, r2
6. 33d0092c: ebffffef bl 33d008f0
7. ... ...
8. 33d00984: ebffff14 bl 33d005dc
9. ... ...
10. 33d009a8: e3a00000 mov r0, #0 ; 0x0
11. 33d009ac: e8bd8070 pop {r4, r5, r6, pc}
12.
13. 33d009b0 :
14. 33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000
15. 33d009b4: e3a03005 mov r3, #5 ; 0x5
16. 33d009b8: e5823014 str r3, [r2, #20]
17. ... ...
18. 33d009f8: e1a0f00e mov pc, lr
(1)clock_init部分的代碼
可以看到該函數(shù)第一行:
1. 33d009b0: e3a02313 mov r2, #1275068416 ; 0x4c000000
就沒(méi)有我們所期望的push指令,沒(méi)有去將一些寄存器的值放到堆棧中。這是因?yàn)?,我們clock_init這部分的內(nèi)容,所用到的r2,r3等等寄存器,和前面調(diào)用clock_init之前所用到的寄存器r0,沒(méi)有沖突,所以此處可以不用push去保存這類寄存器的值,不過(guò)有個(gè)寄存器要注意,那就是r14,即lr,其是在前面調(diào)用clock_init的時(shí)候,用的是bl指令,所以會(huì)自動(dòng)把跳轉(zhuǎn)時(shí)候的pc的值賦值給lr,所以也不需要push指令去將PC的值保存到堆棧中。
而clock_init的代碼的最后一行:
1. 33d009f8: e1a0f00e mov pc, lr
就是我們常見的mov pc, lr,把lr的值,即之前保存的函數(shù)調(diào)用時(shí)候的PC值,賦值給現(xiàn)在的PC,這樣就實(shí)現(xiàn)了函數(shù)的正確的返回,即返回到了函數(shù)調(diào)用時(shí)候下一個(gè)指令的位置。
這樣CPU就可以繼續(xù)執(zhí)行原先函數(shù)內(nèi)剩下那部分的代碼了。
(2)CopyCode2Ram部分的代碼
1. 33d0091c: e92d4070 push {r4, r5, r6, lr}
就是我們所期望的,用push指令,保存了r4,r5,r以及l(fā)r。用push去保存r4,r5,r6,那是因?yàn)樗^的保存現(xiàn)場(chǎng),以后后續(xù)函數(shù)返回時(shí)候再恢復(fù)現(xiàn)場(chǎng),而用push去保存lr,那是因?yàn)榇撕瘮?shù)里面,還有其他函數(shù)調(diào)用:
1. 33d0092c: ebffffef bl 33d008f0
2. ... ...
3. 33d00984: ebffff14 bl 33d005dc
4. ... ...
也用到了bl指令,會(huì)改變我們最開始進(jìn)入clock_init時(shí)候的lr的值,所以我們要用push也暫時(shí)保存起來(lái)。而對(duì)應(yīng)地,CopyCode2Ram的最后一行:
1. 33d009ac: e8bd8070 pop {r4, r5, r6, pc}
就是把之前push的值,給pop出來(lái),還給對(duì)應(yīng)的寄存器,其中最后一個(gè)是將開始push的lr的值,pop出來(lái)給賦給PC,因?yàn)閷?shí)現(xiàn)了函數(shù)的返回。另外,我們注意到,在CopyCode2Ram的倒數(shù)第二行是:
1. 33d009a8: e3a00000 mov r0, #0 ; 0x0
是把0賦值給r0寄存器,這個(gè)就是我們所謂返回值的傳遞,是通過(guò)r0寄存器的。
此處的返回值是0,也對(duì)應(yīng)著C語(yǔ)言的源碼中的“return 0”.
對(duì)于使用哪個(gè)寄存器來(lái)傳遞返回值:
當(dāng)然你也可以用其他暫時(shí)空閑沒(méi)有用到的寄存器來(lái)傳遞返回值,但是這些處理方式,本身是根據(jù)ARM的APCS的寄存器的使用的約定而設(shè)計(jì)的,你最好不要隨便改變使用方式,最好還是按照其約定的來(lái)處理,這樣程序更加符合規(guī)范。
評(píng)論