标签: hyperthreading

为什么在启用超线程后性能会变差？

我将Linux内核2.6.32移植到Intel(R)Xeon(R)CPU E31275 @ 3.40GHz.如果我在BIOS中启用超线程,我可以看到8个CPU内核(CPU0~CPU7).大多数中断发生在CPU 4中,并且该核心的CPU使用率远高于其他中断(几乎是其他中断的两倍).我不太了解它,因为我认为我没有设置任何IRQ绑定操作.

如果我在BIOS中禁用超线程,那么一切正常.IRQ已经平衡,所有内核(CPU0~CPU3)的CPU使用率也几乎是平衡的.

有人可以解释一下吗？它与BIOS有关吗？我应该在内核中做一些特殊设置吗？

linux scheduling intel hyperthreading linux-kernel

fly*_*pen

2014 09-22

4
推荐指数

1
解决办法

1万
查看次数

不同的进程可以同时运行RDTSC吗？

不同的进程可以同时运行RDTSC吗？还是这是只有一个内核可以同时运行的资源？TSC位于每个内核中（至少您可以针对每个内核分别进行调整），因此应该可行。但是超级跑步呢？

我该如何测试？

x86 multicore intel hyperthreading rdtsc

kug*_*uga

2019 06-04

4
推荐指数

1
解决办法

68
查看次数

当另一个进程共享相同的HT内核时，为什么一个进程的执行时间更短

我有一个带有4个HT内核（8个逻辑CPU）的Intel CPU，并构建了两个简单的进程。

第一个：

int main()
{
  for(int i=0;i<1000000;++i)
    for(int j=0;j<100000;++j);
}

Run Code Online (Sandbox Code Playgroud)

第二个：

int main()
{
  while(1);
}

Run Code Online (Sandbox Code Playgroud)

两者都编译时gcc没有特殊选项。（即默认值为-O0：无优化调试模式，将变量保留在内存中而不是寄存器中。）

当我在第一个逻辑CPU（CPU0）上运行第一个时，并且当其他逻辑CPU的负载费用接近0％时，此第一个进程的执行时间为：

real    2m42,625s
user    2m42,485s
sys     0m0,070s

Run Code Online (Sandbox Code Playgroud)

但是，当我在CPU4上运行第二个进程（无限循环）时（CPU0和CPU4在同一内核上，但不在同一硬件线程上），第一个进程的执行时间为

real    2m25,412s
user    2m25,291s
sys     0m0,047s

Run Code Online (Sandbox Code Playgroud)

我期望更长的时间，因为在同一核心上有两个进程，而不是只有一个。但这实际上更快。为什么会这样？

编辑：P状态驱动程序是intel_pstate。使用来固定C状态processor.max_cstate=1 intel_idle.max_cstate=0。将调速器设置为性能（cpupower frequency-set -g performance），禁用涡轮增压（cat /sys/devices/system/cpu/intel_pstate/no_turbo给出1）

linux performance x86 intel hyperthreading

seb*_*hat

2019 09-29

4
推荐指数

1
解决办法

125
查看次数

超线程有AVX的问题吗？

在玩超频和运行刻录测试时,我注意到,启用超线程时,AVX优化版LINPACK测量的多线程浮点吞吐量低于禁用超线程的浮点数.这是在Ivy Bridge i7(3770k)上.我还注意到,尽管我在较低的核心电压下运行CPU,但是使用超线程禁用LINPACK导致更高的核心温度.所有这些让我相信,如果没有超线程,管道利用率实际上更高.

我很好奇:这只是LINPACK算法固有的东西导致管道停顿或SMT效率低下的问题,或者当两个线程发出宽SIMD指令时,英特尔的SMT实现是否合法地调度流水线？如果是这样,那么Haswell已经解决了这个问题,还是将来会在未来的英特尔架构中解决？这是AVX512容易出现的问题吗？

最后,在使用AVX进行英特尔系统编程时,是否有任何好的步骤可以避免使用SMT进行低效的流水线分配？

multithreading hyperthreading avx

lcm*_*lin

lucky-day

3
推荐指数

1
解决办法

1623
查看次数