使用立即数操作数对 x86-16 指令进行编码

mat*_*ack 2 x86 assembly machine-code instruction-encoding

我正在尝试解码指令,目前在 80x86 16 位机器上,在解码没有立即值作为源操作数的指令时没有太多问题,当源操作数不再是寄存器或寄存器时,就会出现问题。位置内存而是一个立即值。下面的指令我会这样解码:

mov ax, 3

101110|11| |11|000|000| 00000011 -> 3 with sign expansion
      |       |   |  register AX
      s = 1   |  null
      w = 1   |
              the second operand is a register
Run Code Online (Sandbox Code Playgroud)

相反,这是不公平的。这是正确的解码:

mov ax, 3

10111000 00000011 0000000
Run Code Online (Sandbox Code Playgroud)

有人可以向我解释一下假设源操作数是立即值的话解码是如何工作的吗?

Sep*_*and 7

x86 的解码通过查阅表格进行。

操作码

如果给你一个字节,你已经知道它是指令操作码(而不是指令前缀),并且该字节将保存值 B8h (10111000b),你会在表中看到它代表mov ax, imm16

opcode       immediate
-----------  --------------------
1011_1_000b, 00000011b, 00000000b
     ^  ^
     |  AX
     w-bit
Run Code Online (Sandbox Code Playgroud)

在第一个代码片段中,您尝试剖析 BBh (10111011b) 操作码,但如果您查阅相同的表,您会发现它代表mov bx, imm16.

opcode       immediate
-----------  --------------------
1011_1_011b, 00000011b, 00000000b
     ^  ^
     |  BX
     w-bit
Run Code Online (Sandbox Code Playgroud)

然而,还有第二种方法可以mov ax, imm16使用 modr/m 字节对指令进行编码,就像您在第一个片段中尝试的那样:

opcode      modr/m       immediate
----------  -----------  --------------------
1100011_1b, 11_000_000b, 00000011b, 00000000b
        ^   ^   ^   ^
        |   |   |   r/m is AX
        |   |   000
        |   mod=11b => r/m is register
        w-bit
Run Code Online (Sandbox Code Playgroud)

该操作码没有 s 位;没有可用的标志扩展。因此,关心代码大小的汇编程序很少使用这种编码。

ADDADCSUBSBBCMPANDORXOR和指令存在一对类似的编码TEST。但对于这些,缩写形式,即没有 modr/m 字节的形式,仅适用于寄存器AX

您可以在英特尔手册中找到所需的所有表格:https://software.intel.com/content/www/us/en/develop/articles/intel-sdm.html