Kau*_*der 16 x86 assembly nasm cpu-registers
任何人都可以告诉我纯粹的汇编代码以十进制格式显示寄存器中的值吗?请不要建议使用printf hack,然后使用gcc进行编译.
描述:
好吧,我做了一些研究和NASM的一些实验,并认为我可以使用c库中的printf函数来打印整数.我是通过使用GCC编译器编译目标文件来完成的,所有工作都很公平.
但是,我想要实现的是以十进制形式打印存储在任何寄存器中的值.
我做了一些研究,发现DOS命令行的中断向量021h可以显示字符串和字符,而2或9位于ah寄存器中,数据在dx中.
结论:
我找到的所有示例都没有显示如何在不使用C库的printf的情况下以十进制形式显示寄存器的内容值.有没有人知道如何在装配中这样做?
Ira*_*ter 15
您需要编写二进制到十进制转换例程,然后使用十进制数字生成"数字字符"进行打印.
你必须假设某个地方的东西会在你选择的输出设备上打印一个字符.调用这个子程序"print_character"; 假设它在EAX中需要一个字符代码并保留所有寄存器..(如果你没有这样的子程序,你还有一个额外的问题应该是另一个问题的基础).
如果您在寄存器(例如,EAX)中具有数字的二进制代码(例如,0-9中的值),则可以通过添加"零"字符的ASCII代码将该值转换为数字的字符登记册.这很简单:
add eax, 0x30 ; convert digit in EAX to corresponding character digit
Run Code Online (Sandbox Code Playgroud)
然后,您可以调用print_character来打印数字字符代码.
要输出任意值,您需要选择数字并打印它们.
从根本上挑选数字需要使用10的权力.最简单的方法是使用十个幂,例如10个本身.想象一下,我们有一个除以10的例程,该例程在EAX中取值,并在EDX中产生商,在EAX中产生余数.我把它作为练习让你弄清楚如何实现这样的例程.
然后一个具有正确想法的简单例程就是为该值可能具有的所有数字生成一个数字.32位寄存器存储的值为40亿,因此您可能会打印10位数.所以:
mov eax, valuetoprint
mov ecx, 10 ; digit count to produce
loop: call dividebyten
add eax, 0x30
call printcharacter
mov eax, edx
dec ecx
jne loop
Run Code Online (Sandbox Code Playgroud)
这有效...但以相反的顺序打印数字.哎呀!好吧,我们可以利用下推堆栈来存储生成的数字,然后以相反的顺序将它们弹出:
mov eax, valuetoprint
mov ecx, 10 ; digit count to generate
loop1: call dividebyten
add eax, 0x30
push eax
mov eax, edx
dec ecx
jne loop1
mov ecx, 10 ; digit count to print
loop2: pop eax
call printcharacter
dec ecx
jne loop2
Run Code Online (Sandbox Code Playgroud)
作为练习留给读者:压制前导零.此外,由于我们将数字字符写入内存,而不是将它们写入堆栈,我们可以将它们写入缓冲区,然后打印缓冲区内容.也留给读者练习.
您需要手动将二进制整数转换为 ASCII 十进制数字的字符串/数组。 ASCII 数字由'0'
(0x30) 到'9'
(0x39)范围内的 1 字节整数表示。 http://www.asciitable.com/
对于像十六进制这样的 2 的幂,请参阅如何将二进制整数转换为十六进制字符串? 在二进制和 2 的幂数之间进行转换允许进行更多的优化和简化,因为每组位分别映射到一个十六进制/八进制数字。
大多数操作系统/环境没有接受整数并将它们转换为十进制的系统调用。在将字节发送到操作系统之前,您必须自己执行此操作,或者自己将它们复制到显存中,或者在显存中绘制相应的字体字形...
到目前为止,最有效的方法是进行一次系统调用,一次处理整个字符串,因为写入 8 个字节的系统调用与写入 1 个字节的成本基本相同。
这意味着我们需要一个缓冲区,但这根本不会增加我们的复杂性。2^32-1 只是 4294967295,只有 10 位十进制数字。我们的缓冲区不需要很大,所以我们可以使用堆栈。
通常的算法产生数字 LSD-first(最低有效数字在前)。由于打印顺序是 MSD 优先,我们可以从缓冲区的末尾开始,然后向后工作。对于其他地方的打印或复制,只需跟踪它的开始位置,而不必费心将其置于固定缓冲区的开始处。无需使用 push/pop 来反转任何东西,只需首先向后生成它。
char *itoa_end(unsigned long val, char *p_end) {
const unsigned base = 10;
char *p = p_end;
do {
*--p = (val % base) + '0';
val /= base;
} while(val); // runs at least once to print '0' for val=0.
// write(1, p, p_end-p);
return p; // let the caller know where the leading digit is
}
Run Code Online (Sandbox Code Playgroud)
gcc/clang 做得非常好,它使用神奇的常数乘法器而不是div
有效地除以 10。(用于 asm 输出的Godbolt 编译器资源管理器)。
这个代码审查问答有一个很好的高效 NASM 版本,它将字符串累积到一个 8 字节的寄存器而不是内存中,准备好存储你希望字符串在没有额外复制的情况下开始。
在无符号绝对值上使用此算法。( if(val<0) val=-val;
). 如果原始输入为负,则'-'
在完成后将 a放在最后。例如,使用-10
运行它10
,产生 2 个 ASCII 字节。然后将 a 存储'-'
在前面,作为字符串的第三个字节。
这是一个简单的注释 NASM 版本,使用div
(缓慢但较短的代码)用于 32 位无符号整数和 Linuxwrite
系统调用。 它应该很容易端口这32位模式的代码只是通过改变寄存器ecx
代替rcx
。但是add rsp,24
会变成add esp, 20
因为push ecx
只有 4 个字节,而不是 8 个。(您还应该保存/恢复esi
通常的 32 位调用约定,除非您将其设置为宏或仅供内部使用的函数。)
系统调用部分特定于 64 位 Linux。将其替换为适合您系统的任何内容,例如调用 VDSO 页面以获得 32 位 Linux 上的高效系统调用,或int 0x80
直接用于低效系统调用。请参阅Unix/Linux 上 32 位和 64 位系统调用的调用约定。
如果您只需要字符串而不打印它,rsi
则在离开循环后指向第一个数字。您可以将它从 tmp 缓冲区复制到您真正需要它的任何地方的开头。或者,如果您直接将其生成到最终目的地(例如,传递一个指针 arg),您可以填充前导零,直到到达您为它留下的空间的前面。没有简单的方法可以在开始之前找出它将是多少位数字,除非您总是用零填充到固定宽度。
ALIGN 16
; void print_uint32(uint32_t edi)
; x86-64 System V calling convention. Clobbers RSI, RCX, RDX, RAX.
global print_uint32
print_uint32:
mov eax, edi ; function arg
mov ecx, 0xa ; base 10
push rcx ; newline = 0xa = base
mov rsi, rsp
sub rsp, 16 ; not needed on 64-bit Linux, the red-zone is big enough. Change the LEA below if you remove this.
;;; rsi is pointing at '\n' on the stack, with 16B of "allocated" space below that.
.toascii_digit: ; do {
xor edx, edx
div ecx ; edx=remainder = low digit = 0..9. eax/=10
;; DIV IS SLOW. use a multiplicative inverse if performance is relevant.
add edx, '0'
dec rsi ; store digits in MSD-first printing order, working backwards from the end of the string
mov [rsi], dl
test eax,eax ; } while(x);
jnz .toascii_digit
;;; rsi points to the first digit
mov eax, 1 ; __NR_write from /usr/include/asm/unistd_64.h
mov edi, 1 ; fd = STDOUT_FILENO
lea edx, [rsp+16 + 1] ; yes, it's safe to truncate pointers before subtracting to find length.
sub edx, esi ; length=end-start, including the \n
syscall ; write(1, string, digits + 1)
add rsp, 24 ; (in 32-bit: add esp,20) undo the push and the buffer reservation
ret
Run Code Online (Sandbox Code Playgroud)
公共区域。 随意将其复制/粘贴到您正在处理的任何内容中。如果它坏了,你可以保留两块。(如果性能很重要,请参阅下面的链接;您需要乘法逆而不是div
。)
这是在循环中调用它的代码,它倒计时到 0(包括 0)。把它放在同一个文件中很方便。
ALIGN 16
global _start
_start:
mov ebx, 100
.repeat:
lea edi, [rbx + 0] ; put +whatever constant you want here.
call print_uint32
dec ebx
jge .repeat
xor edi, edi
mov eax, 231
syscall ; sys_exit_group(0)
Run Code Online (Sandbox Code Playgroud)
组装和链接
yasm -felf64 -Worphan-labels -gdwarf2 print-integer.asm &&
ld -o print-integer print-integer.o
./print_integer
100
99
...
1
0
Run Code Online (Sandbox Code Playgroud)
使用strace
地看到,只有系统调用这个程序可以是write()
和exit()
。(另请参阅x86标签 wiki底部的 gdb / 调试提示,以及那里的其他链接。)
相关:
NASM 程序集将输入转换为整数?是另一个方向,string->int。
使用 AT&T 语法将整数打印为字符串,使用 Linux 系统调用而不是 printf - AT&T 版本的相同内容(但适用于 64 位整数)。有关性能的更多评论,以及div
使用mul
.
此代码审查问答使用乘法逆运算,并将字符串累积到一个 8 字节的寄存器中,而不是存储到您希望字符串开始而不需要额外复制的内存中。
如何将二进制整数转换为十六进制字符串?- 2 的幂是特殊的。答案包括标量循环(分支和表查找)和 SIMD(SSE2、SSSE3、AVX2 和 AVX512,这真是太棒了。)
如何真正快速地打印整数的博客文章比较了 C 中的一些策略。例如x % 100
创建更多的 ILP(指令级并行),以及查找表或更简单的乘法逆(只需要在有限的范围内工作,就像这样answer ) 将 0..99 的余数分解为 2 个十进制数字。
例如(x * 103) >> 10
使用一个imul r,r,imm8
/shr r,10
如另一个答案所示。可能以某种方式将其折叠到余数计算本身中。
https://tia.mat.br/posts/2014/06/23/integer_to_string_conversion.html类似的文章。
我想你想将值打印到标准输出?如果是这种情况,
您必须使用系统调用来执行此操作。系统调用取决于操作系统。
例如Linux: Linux系统调用表
本教程中的 hello world 程序可能会给您一些见解。
归档时间: |
|
查看次数: |
33645 次 |
最近记录: |