相关疑难解决方法(0)

为什么在x86程序集中执行"mov esp,ebp"？

据说该leave指令与以下内容相同:

mov esp,ebp
pop ebp

Run Code Online (Sandbox Code Playgroud)

但这是mov esp,ebp为了什么？这对我来说似乎没有用......

x86 assembly

com*_*fan

2015 08-12

62
推荐指数

1
解决办法

4万
查看次数

为什么Mac ABI需要x86-32的16字节堆栈对齐？

我可以理解旧PPC RISC系统的这个要求,甚至是x86-64,但是对于旧的,经过验证的x86？在这种情况下,堆栈只需要在4字节边界上对齐.是的,某些MMX/SSE指令需要16字节对齐,但如果这是被调用者的要求,则应确保对齐正确.为什么要为每个来电者增加这项额外要求？这实际上可能会导致性能下降,因为每个呼叫站点都必须管理此要求.我错过了什么吗？

更新:在对此进行一些调查并与一些内部同事进行一些咨询后,我对此有一些理论:

PPC,x86和x64版操作系统之间的一致性
似乎GCC codegen现在始终执行子esp,xxx然后将数据"移动"到堆栈而不是简单地执行"推送"指令.在某些硬件上,这实际上可能更快.
虽然这确实使调用站点变得复杂,但是当使用默认的"cdecl"约定时,调用者清理堆栈时几乎没有额外的开销.

我对最后一项的问题是,对于依赖于被调用者清理堆栈的调用约定,上述要求实际上 "uglify"了codegen.例如,某些编译器决定为自己的内部使用实现更快的基于寄存器的调用样式(即任何不打算从其他语言或源调用的代码)？这种堆栈对齐可能会通过在寄存器中传递一些参数来抵消一些性能提升.

更新:到目前为止,唯一真正的答案是一致性,但对我来说,答案有点太容易了.我有超过20年的x86架构经验,如果一致性,而不是性能,或其他具体的东西,那么我真的是因为我恭敬地建议开发人员要求它有点天真.他们忽略了近三十年的工具和支持.特别是如果他们期望工具供应商能够快速轻松地为他们的平台调整他们的工具(可能不是......这是 Apple ......),而不必跳过几个看似不必要的箍.

我会在另一天左右给出这个话题,然后关闭它......