函数调用流程
目标:函数调用前后栈保持不变
- 保存main函数的寄存器上下文
- 移动栈指针,到新栈
- 调用新函数:新函数会开辟内存然后操作
- 恢复栈指针
栈相关寄存器及的作用简介
寄存器功能
ESP/RSP:堆栈指针寄存器,指向栈顶。栈顶指针
EBP/RBP:栈底指针,指向栈的底部,通常用ebp+偏移量的形式来定位函数存放在栈中的局部变量
rax:通常用于存储函数调用返回值
rdi:第一个入参
rsi:第二个入参
rdx:第三个入参
rcx:第四个入参
r8:第五个入参
r9:第六个入参
寄存器ebp作为当前函数的“栈帧”基地址,配合一定的偏移,就可以读、写函数体的临时变量。如果一个变量是通过ebp寄存器间接访问的,那么它往往是临时变量,也叫“栈”变量。
指令功能
push rbp 保存栈桢,保存rbp值
1. rbp里面的值放到当前rsp指向的位置,保存当前栈底指针的值
2. 然后rsp–,栈顶指针向上移动
pop eax 恢复栈帧
1. 栈顶指针向下移动,这里的值保存的是原函数的栈底位置
2. ebp指向esp里面值的位置,移动栈底指针到原函数位置
call
1. 会把下一条指令的地址也就是当前函数要执行的下一条指令的地址,保存到栈中。
2.将func函数地址填入程序计数器来执行。
ret 指令,是把保存在栈中的地址设定到程序计数器中,让CPU进行执行
栈
栈是存储临时数据的区域,在普通内存中,它的特点是通过push指令和pop指令进行数据的存储和读出。往栈中存储数据称为“入栈”,从栈中读出数据称为“出栈”。32位x86系列的CPU中,进行1次push或pop,即可处理32位(4字节)的数据。push指令和pop指令中只有一个操作数。该操作数表示的是“push的是什么及pop的是什么”,而不需要指定“对哪一个地址编号的内存进行push或pop”。
这是因为,对栈进行读写的内存地址是由esp寄存器(栈指针)进行管理的。push指令和pop指令运行后,esp寄存器的值会自动进行更新(push指令是-4, pop命令是+4),因而程序员就没有必要指定内存地址了。
栈是由大地址向小地址递减,而堆和普通内存是小地址到大地址递增
操作系统会为每个任务(进程或线程)分配一段内存当作任务“堆栈”;CPU则提供两个寄存器esp、ebp,用来标识当前函数对“堆栈”的使用情况。随着函数的逐层调用,函数的“栈帧”会逐次堆叠,互不重合;随着函数的逐层返回,函数的“栈帧”会被就地放弃,但不会清理内存
函数的括号{}
其实函数的调用主要部分就是正反括号的内容。
正负括号都对应两条指令。
正括号
先看正括号,作用是保存原栈
- push rbp :
- rbp里面的值放到当前rsp指向的位置,保存当前栈底指针的值
- 然后rsp–,栈顶指针向上移动。至此,main函数的“栈帧”保护工作完成。
- mov rbp, rsp,更新一下“栈帧”基准线,让ebp指向esp,这里就是新的func的栈了
反括号
然后看反括号两条指令:反括号作用是恢复栈
- pop, 把事先压入“栈顶”的ebp值返还给CPU寄存器ebp。这样蓝色基准线就恢复到了最开始的位置。然后esp红色水位线也随之下降。esp和ebp的值就都恢复了。
- ret指令,把“栈顶”处的返回值传给CPU寄存器rip,这样,CPU就可以跳转到主调函数main被打断的地方0x401105e继续执行了。
参数传递
先看下传递参数的汇编:
- 传值调用和传指针其实都是将值传递到函数中,只不过这个值含义不同指针是一个地址的值。
- 还可以看出用作传参的寄存器是哪几个。
传值,变量不可改
我们接着看函数中,对参数赋值的汇编:
1. 这里会将参数寄存器中的值,放入栈中。然后释放参数寄存器。
2. 然后将内存地址数据赋值。
3. 这也就说明原来参数的值被复制了一份到内存中,修改当前形参的值,实际是修改栈中内存的值,原变量不会被修改
传指针,变量可改
- 首先还是将参数的值放入内存中,释放寄存器
- 然后将参数x的内存地址传给寄存器,寄存器当前存储的是该地址
- 然后向该寄存器中存储的地址中,写入0.
这也就直接修改了内存中原变量的值,这里的寄存器rax起到了一个中间过渡作用。
Q:为什么传递参数是通过CPU寄存器,而不是直接压入堆栈呢?
A:传递参数,也可以不通过CPU寄存器,而通过压入堆栈的方式,一些老版本的编译器,也是如此操作的。但通过寄存器传递,可以避免一些内存操作,一定程度上有利于提高函数的执行效率。
C++ 传引用
C++ 传引用和传指针的汇编相同,所以传引用只是一个语法糖
函数调用实例
- push, mov 保存栈帧,移动栈指针到新栈
- 因为要传递参数,所以将4和3存入到寄存器esi和edi
- 调用func函数
- push mov保存栈帧,移动栈指针到新栈
- 将参数寄存器edi和esi的值放到栈内存中
- 1和2的值放到栈内存中
- 将1的值放到eax寄存器中当作返回值
- 恢复栈桢,跳转回函数执行
- 将0放到eax中当作返回值
函数返回值
函数返回值对应的指令其实就是 mov eax 1
实际上就是把值放入eax寄存器。
那么函数返回值有以下几个注意点:
- 函数返回值无论是存变量还是指针变量,都是把一个值放到rax寄存器中。
- 函数返回值放到rax寄存器中所以最大64位,想通过寄存器rax返回超过8字节的数据是不可能的。例如,我们想写一个函数,让其返回数组、字符串时,编译器一定会百般阻挠。
- 函数返回值不要放入栈中的临时对象,虽然有时候栈中该变量不会被立即清理,但是还是有风险,所以只能返回提前申请malloc申请的堆中内存。
文章评论