x86 32位汇编代码是否有效x86 64位汇编代码?

Shu*_*eng 2 windows binary x86 assembly

是否所有x86 32位汇编代码都有效x86 64位汇编代码?

我想知道32位汇编代码是否是64位汇编代码的子集,即每个32位汇编代码是否可以在64位环境中运行?

我想答案是肯定的,因为64位Windows能够执行32位程序,但后来我看到64位处理器支持32位兼容模式?

如果没有,请提供一个32位汇编代码的小例子,它不是有效的64位汇编代码,并解释了64位处理器如何执行32位汇编代码.

fuz*_*fuz 7

现代x86 CPU有三种主要的操作模式(简化了这个描述):

  • 实模式下, CPU执行16位代码,禁用分页和分段.代码中的内存地址是指phyiscal地址,段寄存器的内容被移位并添加到地址中以形成有效地址.
  • 保护模式下,CPU根据CS(代码段)寄存器中的段选择器执行16位或32位代码.启用分段,可以(通常是)启用分页.程序可以在16位和32位代码之间切换到适当的段.CPU可以进入子模式虚拟8086模式,以模拟来自受保护模式操作系统内的各个进程的实模式.
  • 长模式下, CPU执行64位代码.分段大多禁用,启用分页.CPU可以进入子模式兼容模式,以在为长模式 写入的操作系统内执行16位和32位保护模式代码.通过远程跳转到具有相应位设置的CS选择器进入兼容模式.虚8086模式不可用.

那么16位,32位和64位模式有什么区别?

除了以下差异外,16位和32位模式基本相同:

  • 在16位模式下,默认地址和操作数宽度为16位.您可以使用0x67和0x66前缀将这些更改为32位.在32位模式下,它是相反的.
  • 在16位模式下,指令指针被截断为16位,跳转到高于65536的地址会导致奇怪的结果.
  • AVX和任何VEX编码指令在16位模式下不可用.
  • 16位模式比32位模式具有更少的寻址模式,但如果需要,可以切换到32位寻址模式.

现在,64位模式有些不同.大多数指令的行为与32位模式类似,但有以下区别:

  • 还有8个寄存器名为r8,r9,...,r15.每个寄存器可用作字节,字,双字或qword寄存器.REX前缀族(0x40到0x4f)编码操作数是指旧的还是新的寄存器.另外还有8个寄存器SSE寄存器xmm8,xmm9,...,xmm15.
  • 你只能推/弹64位和16位数量(虽然你不应该这样做),32位数量无法推送.
  • 单字节incdec指令不可用,它们的指令空间已被重新用于REX前缀.两个字节inc,并dec仍然是可用的,所以inc regdec reg仍然可以进行编码.
  • 存在新的指令指针相对寻址模式.
  • 默认地址宽度为64位,可以通过0x67前缀选择32位地址宽度.16位寻址不可用.
  • 默认操作数宽度为32位.可以通过0x66前缀选择16位宽度,可以通过适当的REX前缀选择64位宽度,与您使用的寄存器无关.
  • 在需要REX前缀的指令中不能使用AH,BH,CH和DH.
  • 写入64位寄存器的低位会清除高32位.
  • 由于分段不起作用,除了用于支持线程局部存储(TLS)的覆盖fsgs覆盖(0x64,0x65)之外,段覆盖不可用.
  • 此外,许多专门处理分段的指令都不可用.它们是:push/pop seg(除push/pop fs/gs), ,arpl(call far只有0xff的编码是有效的), ,les,lds(jmp far只有0xff的编码是有效的),
  • 与十进制运算处理指令是不可用的,它们是:daa,das,aaa,aas,aam,aad,
  • 另外,以下说明不可用:( bound很少使用),pusha/ popa(对附加寄存器salc没用),(未记录),
  • 0x80的0x82指令别名无效.
  • 在早期的amd64 CPU上,lahf并且sahf不可用.

而这基本上就是全部!


Bee*_*ope 5

不,虽然存在大量重叠,但64位汇编代码不是32位汇编代码的超集,因此32位汇编在64位模式下通常无效.

这适用于助记符汇编(由汇编程序组装成二进制格式),以及二进制机器代码格式本身.

此问题详细介绍了已删除的说明,但也有许多编码形式的含义已更改.

例如,注释中的Jester给出了push eax在64位代码中无效的示例.根据此参考,您可以看到32位推送标记为NE,意味着无法编码.在64位模式下,编码用于表示push rax(8字节推送).因此,相同的字节序列在32位模式与64位模式下具有不同的含义.

通常,您可以浏览该站点上的指令列表,并找到许多列为64位无效或无法编码的列表.

如果没有,请提供一个32位汇编代码的小例子,它不是有效的64位汇编代码,并解释了64位处理器如何执行32位汇编代码.

如上所述,push eax是一个这样的例子.我认为缺少的是64位CPU支持直接运行32位二进制文​​件.它们不是通过机器语言级别的32位和64位指令之间的兼容性来实现的,而只是通过具有32位模式,其中解码器(特别是)将指令流解释为32位x86而不是x86-64,以及运行64位指令的所谓长模式.当这样的64位芯片首次发布时,通常运行32位操作系统,这意味着芯片永久处于这种模式(永远不会进入64位模式).

最近,通常运行一个64位操作系统,它知道这些模式,当用户启动32位进程时,它会将CPU置于32位模式(这仍然很常见:直到最近我的浏览器仍然是32位).

模式的所有细节和正确的术语都可以在fuz的答案中找到,这是你应该阅读的答案.