如何在不使用汇编的情况下为x86编写原始机器代码？

Question

如何在不使用汇编的情况下为x86编写原始机器代码？

我希望能够编写原始机器代码，而无需汇编或任何其他种类的高级语言，而这些语言可以直接放在闪存驱动器上并运行。我已经知道要执行此操作，我需要将主引导记录标头（我已经设法手动完成）格式化到驱动器上。我已完成此操作，并成功使用代码所在驱动器的第一个扇区（在本例中为前512个字节）中的汇编代码，使一行文本显示在屏幕上。但是，我希望能够像在MBR格式化中那样将原始的十六进制代码写入驱动器，而无需诸如汇编之类的任何工具来帮助我。我知道有一种方法可以做到这一点，但是我真的找不到任何不涉及汇编的东西。在哪里可以找到有关此信息？汇编附带了谷歌搜索机器代码或x86编程，这不是我想要的。

Answer 1

Pet*_*des 5

如果您真正想要的是更好地理解 x86 机器代码，我建议您首先查看汇编器的输出，以查看它为每一行 asm 源代码汇编到输出文件中的字节。

nasm -fbin -l listing.txt foo.asm将为您提供一个包含原始十六进制字节和源代码行nasm -fbin -l/dev/stdout foo.asm | less的列表，或者将列表直接传送到文本查看器中。请参阅我在 codegolf.SE 上编写的13 字节 x86 机器代码中的这个色度键混合函数，以获取输出外观示例。

也可以正常创建后反汇编二进制文件。 ndisasm适用于平面二进制文件，并生成相同格式的十六进制字节 + asm 指令。其他反汇编objdump程序也可用：使用 objdump 反汇编平面二进制文件。

半相关：如何将十六进制代码转换为 x86 指令

Intel 的 x86 手册完全指定了指令的编码方式：请参阅vol.2 insn set 参考手册，第 2 章指令格式以了解前缀、操作码、ModR/M + 可选 SIB 和可选位移以及立即数的细分。

鉴于此，您可以阅读有关如何对其进行编码的每条指令文档，例如D1 /4( shl r/m32, 1)表示操作码字节为 D1，而/rModRM的字段必须为 4。（该/r字段用作某些指令的 3 个附加操作码位。 )

还有一个附录将操作码字节映射回指令，以及该手册中的其他部分。

您当然可以使用十六进制编辑器输入您手动计算的编码，以创建 512 字节的二进制文件，而无需使用汇编程序。但这是一个毫无意义的练习。

有关x86 指令编码的许多怪癖，另请参阅在 x86 机器代码中打高尔夫球的技巧：例如，inc/dec完整寄存器有单字节编码（64 位模式除外）。它当然侧重于指令长度，但除非您坚持自己查找实际编码，否则有趣的部分是哪些形式的指令具有不同或特殊的编码可用。该提示问答的几个答案有objdump -d显示机器代码字节和 AT&T 语法反汇编的输出。

Answer 2

old*_*mer 5

只是画画而已...

First off you are not going to find a how to program in machine code, that doesn't have assembly associated with it and that should be obvious. Any decent instruction reference of which most you will find contain the assembly for some assembler along with the machine code, because you really need some way to reference some bit pattern and assembly language is that language.

So look up nop for example you find the bit patter 10010000 or 0x90. So if I want to add the instruction nop to my program I add the byte 0x90. So even if you go back to very early processors you still desired to program in assembly language and hand assemble with pencil and paper then use dip switches to clock the program into memory before trying to run it. Because it just makes sense. Decades later even to demonstrate machine code programming, particularly with a painful instruction set like x86, you start with assembly, assemble, then dissassemble, then talk about it, so here goes:

top:
    mov ah,01h
    jmp one
    nop
    nop
one:
    add ah,01h
    jmp two
two:
    mov bx,1234h
    nop
    jmp three
    jmp three
    jmp three
three:
    nop
    jmp top

nasm -f aout so.s -o so.elf
objdump -D so.elf

00000000 <top>:
   0:   b4 01                   mov    $0x1,%ah
   2:   eb 02                   jmp    6 <one>
   4:   90                      nop
   5:   90                      nop

00000006 <one>:
   6:   80 c4 01                add    $0x1,%ah
   9:   eb 00                   jmp    b <two>

0000000b <two>:
   b:   66 bb 34 12             mov    $0x1234,%bx
   f:   90                      nop
  10:   eb 04                   jmp    16 <three>
  12:   eb 02                   jmp    16 <three>
  14:   eb 00                   jmp    16 <three>

00000016 <three>:
  16:   90                      nop
  17:   eb e7                   jmp    0 <top>

归档时间：	7 年，6 月前
查看次数：	687 次
最近记录：	6 年，3 月前