在浏览一些具有内联汇编的C代码时,我遇到了.byte(开头有一个Dot)指令.
在检查Web上的程序集引用时,我发现它用于在内存中保留一个字节.
但是在代码中,声明之前没有标签.所以我想知道什么是未标记的.byte指令或任何其他数据存储指令的用途.
例如,如果我编码.byte 0x0a,我该如何使用它?
免责声明:单词无法描述我厌恶AT&T风格的语法
我有一个问题,我希望是由寄存器clobbering引起的.如果没有,我有一个更大的问题.
我使用的第一个版本是
static unsigned long long rdtscp(void)
{
unsigned int hi, lo;
__asm__ __volatile__("rdtscp" : "=a"(lo), "=d"(hi));
return (unsigned long long)lo | ((unsigned long long)hi << 32);
}
Run Code Online (Sandbox Code Playgroud)
我注意到这个版本中没有'破坏'的东西.这是否是一个我不知道的问题...我想这取决于编译器是否内联函数.使用此版本会导致我无法始终重现的问题.
我发现的下一个版本是
static unsigned long long rdtscp(void)
{
unsigned long long tsc;
__asm__ __volatile__(
"rdtscp;"
"shl $32, %%rdx;"
"or %%rdx, %%rax"
: "=a"(tsc)
:
: "%rcx", "%rdx");
return tsc;
}
Run Code Online (Sandbox Code Playgroud)
这是令人安心的不可读和官方的看,但就像我说我的问题并不总是可重复的所以我只是试图排除我的问题的一个可能的原因.
我认为第一个版本存在问题的原因是它覆盖了以前持有函数参数的寄存器.
什么是正确的...版本1,或版本2,或两者兼而有之?
在x86汇编中,当有符号整数上的add或sub操作溢出时,溢出标志置位,当无符号整数上的操作溢出时,置载标志置位.
然而,当谈到inc和dec说明,情况似乎有些不同.根据该网站,该inc指令根本不影响进位标志.
但我不能找到有关如何的任何信息inc和dec如果有的话,会影响溢出标志.
发生整数溢出时执行inc或dec设置溢出标志?对于有符号整数和无符号整数,这种行为是否相同?
============================= 编辑 ==================== =========
好的,基本上这里的共识是,就设置标志而言,INC和DEC应该与ADD和SUB的行为相同,但进位标志除外.这也是英特尔手册中的内容.
问题是,当涉及到无符号整数时,我实际上无法在实践中重现这种行为.
请考虑以下汇编代码(使用GCC内联汇编以便更轻松地打印结果.)
int8_t ovf = 0;
__asm__
(
"movb $-128, %%bh;"
"decb %%bh;"
"seto %b0;"
: "=g"(ovf)
:
: "%bh"
);
printf("Overflow flag: %d\n", ovf);
Run Code Online (Sandbox Code Playgroud)
这里我们递减一个带符号的8位值-128.由于-128是可能的最小值,溢出是不可避免的.正如所料,这打印出:Overflow flag: 1
但是当我们使用无符号值执行相同操作时,行为并不像我预期的那样:
int8_t ovf = 0;
__asm__
(
"movb $255, %%bh;"
"incb %%bh;"
"seto %b0;"
: "=g"(ovf)
:
: "%bh"
); …Run Code Online (Sandbox Code Playgroud) 关于存储寄存器变量的一点,我想澄清一下:有没有办法确保如果我们在代码中声明了一个寄存器变量,它只能存储在寄存器中?
#include<iostream>
using namespace std;
int main()
{
register int i=10;// how can we ensure this will store in register only.
i++;
cout<<i<<endl;
return 0;
}
Run Code Online (Sandbox Code Playgroud) 我正在通过关于在Rust中编写操作系统的Phil-Opp教程,并且在稍微玩了一下后,我想摆弄在屏幕上显示真实图形.
我已经想到我应该从使用线性帧缓冲器开始,使用VESA.我在这里和这里找到了osdev.org上的一些教程,但他们继续谈论"功能代码"和es:di.第二个链接说:
功能:获取VESA BIOS信息
功能码:0x4F00
说明:返回VESA BIOS信息,包括制造商,支持的模式,可用的视频内存等...输入:AX = 0x4F00
输入:ES:DI =段:偏移指向存储VESA BIOS信息结构的位置的指针.
输出:成功时AX = 0x004F,其他值表示不支持VESA BIOS.
无论如何,上面的函数返回以下结构并将它存储在ES:DI中,因为它们在输入时.在输入时,ES:DI应包含指向以下结构的指针:
vbe_info_structure: .signature db "VBE2" ; indicate support for VBE 2.0+ .table_data: resb 512-4 ; reserve space for the table below
虽然我已经看了一些汇编语言教程,但我不知道"功能代码"是什么.根据我的理解,如果我mov ax, 0x4f00,并创建一个类似上面的结构,它将神奇地覆盖结构,然后我可以作为参数传递给我的Rust代码?我如何,或者我需要设置我的es:di?(从研究开始,我认为它只是在现代处理器上自动设置)
我应该在Inline Assembly中完成所有这些工作吗?我应该只使用UEFI并重写我的内核吗?如果您能举例说明如何在Rust代码中访问vbe_info_structure(我正在运行long mode),我很乐意.
boot.asm到目前为止,这是我的文件,但它还没有工作:https://gist.github.com/nebrelbug/5a0042d4de32f942bb72e71fe282bdd2.谢谢!
为什么打印垃圾而不是优雅地退出我的程序?我在BSD上以这种方式使用系统调用,我想知道在Linux中它需要什么才能使它工作.
int
main(int argc, char **argv)
{
__asm ("movq $1,%rax; movq $0,%rdi; syscall"); /* exit(0) ? */
return 0;
}
Run Code Online (Sandbox Code Playgroud)
谢谢.
我正在尝试实现一些内联汇编程序(在C/C++代码中)以利用SSE.我想复制和复制值(从XMM寄存器或从内存)到另一个XMM寄存器.例如,假设我在内存中有一些值{1,2,3,4}.我想复制这些值,使xmm1填充{1,1,1,1},xmm2填充{2,2,2,2},依此类推.
查看英特尔参考手册,我找不到执行此操作的说明.我是否只需要使用重复MOVSS和旋转的组合(通过PSHUFD?)?
为什么这段代码没有设置temp为1?我该怎么做呢?
int temp;
__asm__(
".intel_syntax;"
"mov %0, eax;"
"mov eax, %1;"
".att_syntax;"
: : "r"(1), "r"(temp) : "eax");
printf("%d\n", temp);
Run Code Online (Sandbox Code Playgroud) 我可以以某种方式在Haskell中使用内联汇编(类似于GCC对C的内容)吗?
我想将我的Haskell代码与参考实现(ASM)进行比较,这似乎是最简单的方法.我想我可以从C调用Haskell并使用GCC内联汇编,但我仍然感兴趣,如果我可以反过来做.
(我在Linux/x86上)
clang/gcc:一些内联汇编操作数可以满足多个约束,例如"rm",当操作数可以满足寄存器或存储器位置时.例如,64 x 64 = 128位乘法:
__asm__ ("mulq %q3" : "=a" (rl), "=d" (rh) : "%0" (x), "rm" (y) : "cc")
Run Code Online (Sandbox Code Playgroud)
生成的代码似乎为参数选择了一个内存约束3,如果我们注册了饥饿就可以了,以避免溢出.显然,x86-64的注册压力要小于IA32.但是,(通过clang)生成的程序集片段是:
movq %rcx, -8(%rbp)
## InlineAsm Start
mulq -8(%rbp)
## InlineAsm End
Run Code Online (Sandbox Code Playgroud)
选择内存约束显然毫无意义!将约束更改为:"r" (y)但是(强制注册)我们得到:
## InlineAsm Start
mulq %rcx
## InlineAsm End
Run Code Online (Sandbox Code Playgroud)
正如所料.这些结果适用于clang/LLVM 3.2(当前Xcode版本).第一个问题:为什么clang会在这种情况下选择效率较低的约束?
其次,有较少广泛使用的,用逗号分隔,多个替代约束语法:
"r,m" (y),这应该评估各方案的成本,并选择导致较少拷贝的一个.这似乎有效,但是clang只选择了第一个 - 如下所示:"m,r" (y)
我可以简单地删除"m"替代约束,但这并不表示可能的合法操作数的范围.这让我想到第二个问题:这些问题是否已在3.3中得到解决或至少得到承认?我试过查看LLVM开发档案,但我宁愿在不必要地进一步限制约束或加入项目讨论等之前征求一些答案.