我们知道jal指定了一个 21 位的偏移量。但是,它不编码 21 位偏移量而是编码 20 位偏移量。原因是地址的最低有效位始终为零,因为最小可能的 RISC-V 指令是 2 个字节,因此该位未在指令中编码。
通过以这种方式对偏移进行编码,它可以提供 ±1MiB 的跳跃范围。如果jal确实对 LSB 进行编码,它将仅提供 ±512KiB 的跳跃范围。
但是,jalr指定 12 位偏移量的指令确实对 LSB 进行了编码。这将跳跃范围减少到 ±2kiB(而不是 ±4kiB)。我知道它jalr使用 I 型格式,它与addi此类指令的立即数的 LSB 必须编码相同。但是,我认为没有理由必须对jalr.
MIPS 有一个 Load Immediate ( LI) 伪指令,用于将 32 位立即值加载到寄存器中。但它没有Store Immediate( SI)指令来将32位立即值存储到内存中。有人可以解释一下为什么吗?
assembly mips instruction-set immediate-operand instruction-encoding
我正在尝试围绕 x86 指令编码格式。我阅读的所有资料仍然使这个主题变得混乱。我开始有点理解它,但我无法理解的一件事是 CPU 指令解码器如何区分操作码前缀和操作码。
我知道指令的整个格式基本上取决于操作码(当然在操作码中定义了额外的位字段)。有时指令没有前缀,操作码是第一个字节。解码器怎么知道?
我假设指令解码器能够分辨出差异,因为操作码字节和前缀字节不会共享相同的二进制值。因此解码器可以判断字节中唯一的二进制数是指令还是前缀。例如(在本例中,我们将坚持使用单字节操作码)REX或LOCK前缀不会与架构指令集中的任何操作码共享相同的字节值。
x86 assembly cpu-architecture machine-code instruction-encoding
如果我做类似的事情(虚拟示例):
jmp 1f
1: ret
Run Code Online (Sandbox Code Playgroud)
在 gcc/clang 上,它会生成一个短的相对跳转,因为标签很近。
我很好奇,是否可以强制 aJMP rel32无论标签的距离如何?
我想做汇编编译器。为此,我应该研究汇编操作码,所以我在网上找到了这个。当我测试用 NASM 编译一些代码时,如下所示:
add eax, eax
Run Code Online (Sandbox Code Playgroud)
它以二进制输出:
6601C0
其中 ADD 操作码是 00, 01, 02, 03, 04, 05。哪个操作码是正确的?我可以使用所有这些,还是应该使用 01(基于使用 NASM 编译的二进制文件)。
我熟悉 r/m8、r/m16、imm16 等,但如何编码 m16:16、m16:32 和 m16:64?这些在 JMP 和 CALL 指令中......
m16:16 是地址位置吗?或者它就像一个直接地址?任何帮助将不胜感激!
我正在编写自己的汇编程序并尝试对 ADC 指令进行编码,我对立即值有疑问,尤其是在将 8 位值添加到 AX 寄存器时。
添加 16 位值时:adc ax, 0xff33被编码为15 33 ff正确的。但是如果adc ax, 0x33被编码为会重要15 33 00吗?
Nasm 将83 d0 33其编码为显然是正确的,但我的方法也正确吗?
使用 Turbo Assembler 和 Turbo Debugger 稍微玩了一下,我对操作码感到惊讶。更准确地说,我有一些组装好的二进制文件,Turbo Debugger 在其中反汇编了这个词
29 C3
Run Code Online (Sandbox Code Playgroud)
正确地sub bx, ax. 但是,Turbo Assembler 将完全相同的指令组装sub bx, ax到以下单词中
2B D8
Run Code Online (Sandbox Code Playgroud)
对此感到困惑,我发现这个参考文献指出从寄存器中减去寄存器可能确实以29和开头2B。是否真的可以用不同的操作码来表达完全相同的指令?如果是这样,那是为什么?是因为历史原因和兼容性吗?参考说明了操作码的不同操作数类型,它们只是sub bx, ax. 这是为了以后通过自修改代码或类似方式修补不同操作数的能力吗?此外,Turbo Assembler 是否有语法结构来选择一个操作码而不是另一个?
注意:我知道条件跳转类似je并且jz具有相同的操作码,因为它们具有相同的标志相关行为,并且不同的助记符用于反映同一操作的不同语义,但前者让我感到困惑。
我正在尝试解码指令,目前在 80x86 16 位机器上,在解码没有立即值作为源操作数的指令时没有太多问题,当源操作数不再是寄存器或寄存器时,就会出现问题。位置内存而是一个立即值。下面的指令我会这样解码:
mov ax, 3
101110|11| |11|000|000| 00000011 -> 3 with sign expansion
| | | register AX
s = 1 | null
w = 1 |
the second operand is a register
Run Code Online (Sandbox Code Playgroud)
相反,这是不公平的。这是正确的解码:
mov ax, 3
10111000 00000011 0000000
Run Code Online (Sandbox Code Playgroud)
有人可以向我解释一下假设源操作数是立即值的话解码是如何工作的吗?