为什么 strlen 的 REPNE SCASB 实现可以工作?

Nan*_*ish 2 c assembly x86-64 calling-convention strlen

为什么这段代码有效?

http://www.int80h.org/strlen/说字符串地址必须在EDI寄存器中才能scasb工作,但这个汇编函数似乎没有这样做。

汇编代码mystrlen

global  mystrlen
mystrlen:
        sub             ecx, ecx
        not             ecx
        sub             al, al
        cld
        repne scasb
        neg             ecx
        dec             ecx
        dec             ecx
        mov             eax, ecx
        ret
Run Code Online (Sandbox Code Playgroud)

C主:

int mystrlen(const char *);
int main()
{
    return (mystrlen("1234"));
}
Run Code Online (Sandbox Code Playgroud)

汇编:

nasm -f elf64 test.asm
gcc -c main.c
gcc main.o test.o
Run Code Online (Sandbox Code Playgroud)

输出:

./a.out
echo $?
4
Run Code Online (Sandbox Code Playgroud)

Ped*_*d7g 6

问题中的代码是 strlen 的 32 位版本,它仅部分地在 64b 环境中工作,有点“偶然”(因为大多数软件在现实中都可以工作,无论如何;))。

64b 环境的一个意外影响是(在 64b linux 操作系统使用的 System V ABI 中,其他 64b 平台可能遵循不同的调用约定,从而使此无效!),函数调用中的第一个参数通过寄存器传递rdi,并且在 64b 模式下scasb使用,所以这es:rdi自然适合在一起(正如小丑的回答所说)。

其余的 64b 环境效果不太好,该代码将返回 4+G 长字符串的错误值(我知道,在实际使用中极不可能发生,但可以通过提供如此长字符串的综合测试来尝试)。

修复了 64b 版本(例程的结尾也利用 rax=0 在单指令中执行这两项操作neg ecxmov eax,ecx

global  mystrlen
mystrlen:
        xor       ecx,ecx    ; rcx = 0
        dec       rcx        ; rcx = -1 (0xFFFFFFFFFFFFFFFF)
        ; rcx = maximum length to scan
        xor       eax,eax    ; rax = 0 (al = 0 value to scan for)
        repne scasb          ; scan the memory for AL
        sub       rax,rcx    ; rax = 0 - rcx_leftover = scanned bytes + 1
        sub       rax,2      ; fix that into "string length" (-1 for '\0')
        ret
Run Code Online (Sandbox Code Playgroud)