xtensa dissembly 中的大括号

car*_*sV2 1 assembly arduino objdump esp8266 xtensa

我正在反汇编和检查(主要是为了乐趣和学习)为 ESP8266 (Xtensa ISA) 生成的 Arduino 代码。

到目前为止,我一直在跟踪代码,没有出现任何问题,直到4010f4c2主函数中的大括号(位置):

4010f494 <main>:
4010f494:   90a092                  movi    a9, 144
4010f497:   c01190                  sub a1, a1, a9
4010f49a:   00a022                  movi    a2, 0
4010f49d:   236102                  s32i    a0, a1, 140
4010f4a0:   2261c2                  s32i    a12, a1, 136
4010f4a3:   2161d2                  s32i    a13, a1, 132
4010f4a6:   ffc2c5                  call0   4010f0d4 <print_version>
4010f4a9:   202110                  or  a2, a1, a1
4010f4ac:   001045                  call0   4010f5b4 <eboot_command_read>
4010f4af:   00d256                  bnez    a2, 4010f4c0 <main+0x2c>
4010f4b2:   024c                    movi.n  a2, 64
4010f4b4:   fee101                  l32r    a0, 4010f038 <_stext+0x38>
4010f4b7:   0000c0                  callx0  a0
4010f4ba:   1d0c                    movi.n  a13, 1
4010f4bc:   000506                  j   4010f4d4 <main+0x40>
4010f4bf:   af2200                  excw
4010f4c2:   2200a0d2016122ff    { l32r  a15, 400e794c <__udivsi3+0xd9730>; excw }
4010f4ca:   d97ea0                  excw
4010f4cd:   da0121                  l32r    a2, 40105cd4 <__udivsi3+0xf7ab8>
4010f4d0:   9c0c11280000c0fe    { excw; excw; srli  a0, a12, 12 }
4010f4d8:   5a1266                  bnei    a2, 1, 4010f536 <main+0xa2>
4010f4db:   feda21                  l32r    a2, 4010f044 <_stext+0x44>
4010f4de:   fecc01                  l32r    a0, 4010f010 <_stext+0x10>
4010f4e1:   0000c0                  callx0  a0
4010f4e4:   fedd01                  l32r    a0, 4010f058 <_stext+0x58>
4010f4e7:   0000c0                  callx0  a0
4010f4ea:   3138                    l32i.n  a3, a1, 12
4010f4ec:   4148                    l32i.n  a4, a1, 16
4010f4ee:   2128                    l32i.n  a2, a1, 8
4010f4f0:   050c                    movi.n  a5, 0
4010f4f2:   ffcec5                  call0   4010f1e0 <copy_raw>
4010f4f5:   02cd                    mov.n   a12, a2
4010f4f7:   fed901                  l32r    a0, 4010f05c <_stext+0x5c>
4010f4fa:   0000c0                  callx0  a0
4010f4fd:   fed221                  l32r    a2, 4010f048 <_stext+0x48>
4010f500:   0c3d                    mov.n   a3, a12
4010f502:   fec301                  l32r    a0, 4010f010 <_stext+0x10>
4010f505:   0000c0                  callx0  a0
4010f508:   acec                    bnez.n  a12, 4010f536 <main+0xa2>
4010f50a:   f27c                    movi.n  a2, -1
4010f50c:   1129                    s32i.n  a2, a1, 4
4010f50e:   3128                    l32i.n  a2, a1, 12
4010f510:   2129                    s32i.n  a2, a1, 8
4010f512:   2dec                    bnez.n  a13, 4010f538 <main+0xa4>
4010f514:   fece21                  l32r    a2, 4010f04c <_stext+0x4c>
4010f517:   febe01                  l32r    a0, 4010f010 <_stext+0x10>
4010f51a:   0000c0                  callx0  a0
4010f51d:   2128                    l32i.n  a2, a1, 8
4010f51f:   ffbf05                  call0   4010f110 <load_app_from_flash_raw>
4010f522:   02cd                    mov.n   a12, a2
4010f524:   203220                  or  a3, a2, a2
4010f527:   feca21                  l32r    a2, 4010f050 <_stext+0x50>
4010f52a:   feb901                  l32r    a0, 4010f010 <_stext+0x10>
4010f52d:   0000c0                  callx0  a0
4010f530:   0003c6                  j   4010f543 <main+0xaf>
4010f533:   000000                  ill
4010f536:   4d8c                    beqz.n  a13, 4010f53e <main+0xaa>
4010f538:   201110                  or  a1, a1, a1
4010f53b:   000d05                  call0   4010f60c <eboot_command_clear>
4010f53e:   1128                    l32i.n  a2, a1, 4
4010f540:   d00226                  beqi    a2, -1, 4010f514 <main+0x80>
4010f543:   5c9c                    beqz.n  a12, 4010f55c <main+0xc8>
4010f545:   fec341                  l32r    a4, 4010f054 <_stext+0x54>
4010f548:   f37c                    movi.n  a3, -1
4010f54a:   0020c0                  memw
4010f54d:   002422                  l32i    a2, a4, 0
4010f550:   013310                  slli    a3, a3, 31
4010f553:   202230                  or  a2, a2, a3
4010f556:   0020c0                  memw
4010f559:   006422                  s32i    a2, a4, 0
4010f55c:   ffff06                  j   4010f55c <main+0xc8>
Run Code Online (Sandbox Code Playgroud)

4010f4af我以前见过这个,但直到代码到达带有分支指令的位置(4010f4c0该指令正好位于大括号中间)之前,我并没有为此担心。当然,即使这样,如果我尝试应用解析逻辑,在这个字节位置上我会得到ffaf22对应于有效指令的值movi a2, 0xfff

这段代码属于该eboot.elf文件,我将其反汇编如下:

~/.arduino15/packages/esp8266/tools/xtensa-lx106-elf-gcc/3.0.4-gcc10.3-1757bed/xtensa-lx106-elf/bin/objdump -d eboot.elf
Run Code Online (Sandbox Code Playgroud)

你们知道为什么 objdump 显示这些大括号以及为什么它会这样解释它们吗?我是否误解了 Xtensa 手册的部分内容?我可能没有运行正确的命令吗?

非常感谢!

jcm*_*kbc 5

xtensa 汇编器和反汇编器使用大括号表示 VLIW 风格(在 xtensa 世界中通常称为 FLIX)指令包:一组操作码一起解码为一条指令并由处理器并行执行。例如,{ l32r a15, 400e794c <__udivsi3+0xd9730>; excw }可以是双槽指令,l32r操作码在第一个槽中,excw操作码在第二个槽中。但是,如果您在不支持 FLIX 的 xtensa 核心的代码反汇编中看到它们(例如 lx106 不支持 FLIX),通常意味着两件事:1) 反汇编器配置不正确,2) 它可能丢失了指令流并且正在反汇编数据或错误组成的指令字节。

在上面的例子中,我们可以看到指令4010f4af: bnez a2, 4010f4c0 <main+0x2c>直接跳到了指令的中间4010f4bf: excw。这意味着地址 0x4010f4bf 处有一个非指令字节,但反汇编器没有意识到这一点。通常反汇编器使用该部分的内容.xt.prop来区分指令字节和非指令字节,这有助于它保持与指令流的同步,但是当该部分丢失时,它就会像这样失去同步。

关于不正确的配置:当为特定 xtensa 核心构建 binutils 时,需要用为该核心生成的 xtensa 配置覆盖的内容替换 binutils 源中的某些文件。它包含有关该内核的有效操作码、指令格式及其二进制表示形式的信息,汇编器和反汇编器使用它来仅接受和生成有效指令。反汇编中出现内核不支持的指令格式是配置错误的明显迹象。

过度使用excw是虚假反汇编的另一个明显迹象:由于 xtensa 覆盖生成器中的错误(在 xtensa 工具的 RG-2017.5 和 RG-2017.8 版本之间修复),binutils 反汇编程序在以下情况下报告操作码而不是excw任何无法识别的操作码:配置了由有缺陷的工具生成的覆盖层。