相关疑难解决方法(0)

rdtscp,rdtsc:memory和cpuid/rdtsc之间的区别？

假设我们正在尝试使用tsc进行性能监控,我们希望防止指令重新排序.

这些是我们的选择:

1: rdtscp是序列化调用.它可以防止对rdtscp的调用进行重新排序.

__asm__ __volatile__("rdtscp; "         // serializing read of tsc
                     "shl $32,%%rdx; "  // shift higher 32 bits stored in rdx up
                     "or %%rdx,%%rax"   // and or onto rax
                     : "=a"(tsc)        // output to tsc variable
                     :
                     : "%rcx", "%rdx"); // rcx and rdx are clobbered

Run Code Online (Sandbox Code Playgroud)

但是,rdtscp仅适用于较新的CPU.所以在这种情况下我们必须使用rdtsc.但是rdtsc非序列化,因此单独使用它不会阻止CPU重新排序.

所以我们可以使用这两个选项中的任何一个来防止重新排序:

2:这是一个电话cpuid然后rdtsc.cpuid是一个序列化的电话.

volatile int dont_remove __attribute__((unused)); // volatile to stop optimizing
unsigned tmp;
__cpuid(0, tmp, tmp, tmp, …

Run Code Online (Sandbox Code Playgroud)

c c++ performance assembly rdtsc

Ste*_*mer

2012 09-28

61
推荐指数

2
解决办法

3万
查看次数

在x86内核中获取TSC速率

我有一个在Atom上运行的嵌入式Linux系统，这是一个足够新的CPU，具有不变的TSC（时间戳记计数器），内核在启动时测量其频率。我在自己的代码中使用TSC来节省时间（避免内核调用），而我的启动代码会测量TSC速率，但我只想使用内核的度量值。有什么办法可以从内核中检索到它吗？它不在/ proc / cpuinfo中。

linux-kernel tsc

Pau*_*cco

lucky-day

5
推荐指数

2
解决办法

2094
查看次数