匯編 函數(shù)調(diào)用的實現(xiàn)
1. 從代碼的順序執(zhí)行說起
每一個程序員腦子里應該都有這么一種印象:“程序是順序執(zhí)行的”。這個觀點其實和我們開篇所講的cpu的流水線執(zhí)行過程直接相關(guān)。
讓我們再回憶一下腦海中關(guān)于函數(shù)調(diào)用的概念,也許會是這個樣子:
這里的“控制流轉(zhuǎn)移”又是如何發(fā)生的呢?在解釋這個之前,也許我們需要科普一點有關(guān)于匯編的知識。
2. 函數(shù)調(diào)用中的一些細節(jié)說明
2.1 函數(shù)調(diào)用中的關(guān)鍵寄存器
2.1.1 程序計數(shù)器PC
程序計數(shù)器是一個計算機組成原理中講過的概念,下面給出一個百度百科中的簡單解釋
程序計數(shù)器是用于存放下一條指令所在單元的地址的地方。
當執(zhí)行一條指令時,首先需要根據(jù)PC中存放的指令地址,將指令由內(nèi)存取到指令寄存器中,此過程稱為“取指令”。與此同時,PC中的地址或自動加1或由轉(zhuǎn)移指針給出下一條指令的地址。此后經(jīng)過分析指令,執(zhí)行指令。完成第一條指令的執(zhí)行,而后根據(jù)PC取出第二條指令的地址,如此循環(huán),執(zhí)行每一條指令。
可以看到,程序計數(shù)器是一個cpu執(zhí)行指令代碼過程中的關(guān)鍵寄存器:它指向了當前計算機要執(zhí)行的指令地址,CPU總是從程序計數(shù)器取出當前指令來執(zhí)行。當指令執(zhí)行后,程序計數(shù)器的值自動增加,指向下一條將要執(zhí)行的指令。
在x86匯編中,執(zhí)行程序計數(shù)器功能的寄存器被叫做EIP,也叫作指令指針寄存器。
2.1.2 基址指針,棧指針和程序棧
棧是程序設計中的一種經(jīng)典數(shù)據(jù)結(jié)構(gòu),每個程序都擁有自己的程序棧。很重要的一點是,棧是向下生長的。所謂向下生長是指從內(nèi)存高地址->低地址的路徑延伸,那么就很明顯了,棧有棧底和棧頂,那么棧頂?shù)牡刂芬葪5椎?。對x86體系的CPU而言,其中
—> 寄存器ebp(base pointer )可稱為“幀指針”或“基址指針”,其實語意是相同的。
—> 寄存器esp(stack pointer)可稱為“ 棧指針”。
在C和C++語言中,臨時變量分配在棧中,臨時變量擁有函數(shù)級的生命周期,即“在當前函數(shù)中有效,在函數(shù)外無效”。這種現(xiàn)象就是函數(shù)調(diào)用過程中的參數(shù)壓棧,堆棧平衡所帶來的。對于這種實現(xiàn)的細節(jié),我們會在接下來的環(huán)節(jié)中詳細討論。
2.2. 堆棧平衡
堆棧平衡這個概念指的是函數(shù)調(diào)完成后,要返還所有使用過的??臻g。這種說法可能有點抽象,我們可以舉一個簡單的例子來類比:
我們都知道函數(shù)的臨時變量存放在棧中。那我們來看下面的代碼,它是一個很簡單的函數(shù),用來交換傳入的2個參數(shù)的值:
void __stdcall swap(int& a,int& b) { int c = a; a = b; b = c; }
我們可以看到,在這個函數(shù)中使用了一個臨時變量int c;這個變量分配在棧中,我們可以簡單的理解為,在聲明臨時變量c后,我們就向當前的程序棧中壓入了一個int值:
int c = a; <==> push(a); //簡單粗暴,臨時變量的聲明理解為簡單地向棧中push一個值。
那現(xiàn)在這個函數(shù)swap調(diào)用結(jié)束了,我們是否需要退棧,把之前臨時變量c使用的??臻g返還回去?需要嗎?不需要嗎?
我們假設不需要,當我們頻繁調(diào)用swap的時候,會發(fā)生什么?每次調(diào)用,程序棧都在生長。直到棧滿,我們就會收到stack overflow錯誤,程序掛掉了。
所以為了避免這種烏龍的事情發(fā)生,我們需要在函數(shù)調(diào)用結(jié)束后,退棧,把堆棧還原到函數(shù)調(diào)用前的狀態(tài),這些被pop掉的臨時變量,自然也就失效了,這也解釋了我們一直以來關(guān)于臨時變量僅在當前函數(shù)內(nèi)有效的認知。其實堆棧平衡這個概念本身比這種粗淺的理解要復雜的多,還應包括壓棧參數(shù)的平衡,暫時我們可以簡單地這樣理解,后面再做詳細說明。
2.3. 函數(shù)的參數(shù)傳遞和調(diào)用約定
函數(shù)的參數(shù)傳遞是一個參數(shù)壓棧的過程。函數(shù)的所有參數(shù),都會依次被push到棧中。那調(diào)用約定有是什么呢?
C和C++程序員應該對所謂的調(diào)用約定有一定的印象,就像下面這種代碼:
void __stdcall add(int a,int b);
函數(shù)聲明中的__stdcall就是關(guān)于調(diào)用約定的聲明。其中標準C函數(shù)的默認調(diào)用約定是__stdcall,C++全局函數(shù)和靜態(tài)成員函數(shù)的默認調(diào)用約定是__cdecl,類的成員函數(shù)的調(diào)用約定是__thiscall。剩下的還有__fastcall,__naked等。
為什么要用所謂的調(diào)用約定?調(diào)用約定其實是一種約定方式,它指明了函數(shù)調(diào)用中的參數(shù)傳遞方式和堆棧平衡方式。
2.3.1 參數(shù)傳遞方式
還是之前那個例子,swap函數(shù)有2個參數(shù),int a,int b。這兩個參數(shù),入棧的順序誰先誰后?
其實是從左到右入棧還是從右到左入棧都可以,只要函數(shù)調(diào)用者和函數(shù)內(nèi)部使用相同的順序存取參數(shù)即可。在上述的所有調(diào)用約定中,參數(shù)總是從右到左壓棧,也就是最后一個參數(shù)先入棧。我們可以使用一份偽代碼描述這個過程
push b; //先壓入?yún)?shù)b push a; //再壓入?yún)?shù)a call swap; //調(diào)用swap函數(shù)
其實從這里我們就可以理解為什么在函數(shù)內(nèi)部,不能改變函數(shù)外部參數(shù)的值:因為函數(shù)內(nèi)部訪問到的參數(shù)其實是壓入棧的變量值,對它的修改只是修改了棧中的"副本"。指針和引用參數(shù)才能真正地改變外部變量的值。
2.3.2 堆棧平衡方式
因為函數(shù)調(diào)用過程中,參數(shù)需要壓棧,所以在函數(shù)調(diào)用結(jié)束后,用于函數(shù)調(diào)用的壓棧參數(shù)也需要退棧。那這個工作是交給調(diào)用者完成,還是在函數(shù)內(nèi)部自己完成?其實兩種都可以。調(diào)用者負責平衡堆棧的主要好處是可以實現(xiàn)可變參數(shù)(關(guān)于可變參數(shù)的話題,在此不做過多討論。如果可能的話,我們可以以一篇單獨的文章來講這個問題),因為在參數(shù)可變的情況下,只有調(diào)用者才知道具體的壓棧參數(shù)有幾個。
下面列出了常見調(diào)用約定的堆棧平衡方式:
調(diào)用約定 | 堆棧平衡方式 |
---|---|
__stdcall | 函數(shù)自己平衡 |
__cdecl | 調(diào)用者負責平衡 |
__thiscall | 調(diào)用者負責平衡 |
__fastcall | 調(diào)用者負責平衡 |
__naked | 編譯器不負責平衡,由編寫者自己負責 |
2.4. 棧幀的概念:從esp和ebp說起
為什么我們需要ebp和esp2個寄存器來訪問棧?這種觀念其實來自于函數(shù)的層級調(diào)用:函數(shù)A調(diào)用函數(shù)B,函數(shù)B調(diào)用函數(shù)C,函數(shù)C調(diào)用函數(shù)D…
這種調(diào)用可能會涉及非常多的層次。編譯器需要保證在這種復雜的嵌套調(diào)用中,能夠正確地處理每個函數(shù)調(diào)用的堆棧平衡。所以我們引入了2個寄存器:
ebp指向了本次函數(shù)調(diào)用開始時的棧頂指針,它也是本次函數(shù)調(diào)用時的“棧底”(這里的意思是,在一次函數(shù)調(diào)用中,ebp向下是函數(shù)的臨時變量使用的空間)。在函數(shù)調(diào)用開始時,我們會使用把當前的esp保存在ebp中。
mov ebp,esp
esp,它指向當前的棧頂,它是動態(tài)變化的,隨著我們申請更多的臨時變量,esp值不斷減?。ㄕ缜拔乃f,棧是向下生長的)。函數(shù)調(diào)用結(jié)束,我們使用來還原之前保存的esp
mov esp,ebp
在函數(shù)調(diào)用過程中,ebp和esp之間的空間被稱為本次函數(shù)調(diào)用的“棧幀”。函數(shù)調(diào)用結(jié)束后,處于棧幀之前的所有內(nèi)容都是本次函數(shù)調(diào)用過程中分配的臨時變量,都需要被“返還”。這樣在概念上,給了函數(shù)調(diào)用一個更明顯的分界。下圖是一個程序運行的某一時刻的棧幀圖:
3. 匯編中關(guān)于“函數(shù)調(diào)用”的實現(xiàn)
上面鋪陳了很多的匯編層面的概念后,我們終于可以切回到我們本次的主題:函數(shù)調(diào)用。
函數(shù)調(diào)用其實可以看做4個過程,也就是本篇標題:
- 壓棧: 函數(shù)參數(shù)壓棧,返回地址壓棧
- 跳轉(zhuǎn): 跳轉(zhuǎn)到函數(shù)所在代碼處執(zhí)行
- 執(zhí)行: 執(zhí)行函數(shù)代碼
- 返回: 平衡堆棧,找出之前的返回地址,跳轉(zhuǎn)回之前的調(diào)用點之后,完成函數(shù)調(diào)用
3.1 call指令 壓棧和跳轉(zhuǎn)
下面我們看一下函數(shù)調(diào)用指令
0x210000 call swap; 0x210005 mov ecx,eax;
我們可以把它理解為2個指令:
push 0x210005; jmp swap;
也就是,首先把call指令的下一條指令地址作為本次函數(shù)調(diào)用的返回地址壓棧,然后使用jmp指令修改指令指針寄存器EIP,使cpu執(zhí)行swap函數(shù)的指令代碼。
3.2 ret指令 返回
匯編中有ret相關(guān)的指令,它表示取出當前棧頂值,作為返回地址,并將指令指針寄存器EIP修改為該值,實現(xiàn)函數(shù)返回。
下面給出一組示意圖來演示函數(shù)的返回過程:
當前EIP的值為0x210004,指向指令ret 4,程序需要返回
執(zhí)行ret指令,將當前esp指向的堆棧值當做返回地址,設置eip跳轉(zhuǎn)到此處并彈出該值
經(jīng)過這兩步,函數(shù)就返回到了調(diào)用處。
4. 從實際匯編代碼看函數(shù)調(diào)用
4.1 程序源碼和運行結(jié)果
源碼:
main.cpp #include <stdio.h> void __stdcall swap(int& a, int& b); int main(int argc, char* argv) { int a = 1, b = 2; printf("before swap: a = %d, b = %d\r\n", a, b); swap(a, b); printf("after swap: a = %d, b = %d\r\n", a, b); } void __stdcall swap(int& a, int& b) { int c = a; a = b; b = c; }
程序運行結(jié)果:
4.2 反匯編
可以看到,在函數(shù)調(diào)用前,函數(shù)參數(shù)已被壓棧,此時:
EBP = 00AFFCAC
ESP = 00AFFBBC
EIP = 00BF1853
我們按F11,進入函數(shù)內(nèi)部,此時:
其實就是call swap指令的下一條指令地址,它就是本次函數(shù)調(diào)用的返回地址。
下面是一個swap函數(shù)的詳細注釋:
當程序運行到ret 8時
執(zhí)行返回后:
在返回前,ESP = 00AFFBB8,返回后 ESP = 00AFFBC4
0x00AFFBC4 - 0x00AFFBB8 = 0xC
這里的數(shù)值是字節(jié)數(shù),而我們知道,int是4字節(jié)長度。所以0xC/4 = 3
正好是2個壓棧參數(shù)+一個返回地址。
4.3 調(diào)用堆棧
調(diào)試程序的時候,我們經(jīng)常關(guān)注的一個點就是VisualStudio顯示給我們的“調(diào)用堆?!惫δ?,這次讓我們來仔細看一下它:
我們重新執(zhí)行一次程序,這次我們關(guān)注一下vs顯示的調(diào)用堆棧,如下圖
第一行是當前指令地址
第二行是外層調(diào)用者,我們雙擊它,跳轉(zhuǎn)到如下地址:
也許這也是為什么這個功能被叫做“調(diào)用堆?!钡脑颍核峭ㄟ^對程序棧的分析實現(xiàn)的。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
匯編語言實現(xiàn)在指定字符串中搜索字符''A''的方法
這篇文章主要介紹了匯編語言實現(xiàn)在指定字符串中搜索字符'A'的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-02-02匯編指令-狀態(tài)寄存器、cmp、test、jz等指令詳細說明
這篇文章主要介紹了匯編指令-狀態(tài)寄存器、cmp、test、jz等指令詳細說明,需要的朋友可以參考下2020-01-01匯編語言DOSBox及debug.exe在Windows64下環(huán)境搭建
這篇文章主要為大家介紹了匯編語言環(huán)境的搭建DOSBox及debug.exe在Windows64下安裝配置過程,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-11-11匯編語言AND指令實現(xiàn)對兩個操作數(shù)進行邏輯(按位)與操作
這篇文章主要介紹了匯編語言AND指令實現(xiàn)對兩個操作數(shù)進行邏輯(按位)與操作,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-01-01匯編語言80x86系統(tǒng)通用數(shù)據(jù)傳送指令詳解
這篇文章主要為大家介紹了匯編語言80x86系統(tǒng)通用的數(shù)據(jù)傳送指令詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步2021-11-11