相关疑难解决方法(0)

如何计算32位整数中的设置位数？

代表数字7的8位看起来像这样:

00000111

Run Code Online (Sandbox Code Playgroud)

设置三位.

什么算法来确定32位整数中的设置位数？

algorithm binary bit-manipulation hammingweight iec10967

Mat*_*lls

2014 09-19

838
推荐指数

31
解决办法

52万
查看次数

为什么循环指令慢？英特尔无法有效实施吗？

LOOP(英特尔参考手动输入)递减ecx/rcx,然后如果非零则跳转.这很慢,但是英特尔不能廉价地把它变得很快吗？ dec/jnz已经将宏观融合成 Sandybridge家族的一个 uop; 唯一的区别是设置标志.

loop关于各种微体系结构,来自Agner Fog的说明表:

K8/K10:7 m-ops
Bulldozer-family/Ryzen:1 m-op(与宏观融合测试和分支相同,或者jecxz)
P4:4次(相同jecxz)
P6(PII/PIII):8次
Pentium M,Core2:11 uops
Nehalem:6个uops.(11为loope/ loopne).吞吐量= 4c(loop)或7c(loope/ne).
SnB家族:7个uops.(11为loope/ loopne). 吞吐量=每5个循环一个,这是将循环计数器保留在内存中的瓶颈!jecxz只有2 uops,吞吐量与普通吞吐量相同jcc
Silvermont:7次
AMD Jaguar(低功耗):8 uops,5c吞吐量
通过Nano3000:2 uops

难道解码器不能像lea rcx, [rcx-1]/ 那样解码jrcxz吗？这将是3 uops.至少那是没有地址大小前缀的情况,否则它必须使用ecx和截断RIP,EIP如果跳转; 也许奇怪的地址大小选择控制减量的宽度解释了许多uops？

或者更好,只需将其解码为不设置标志的融合分支和分支？ dec ecx …

performance x86 assembly intel cpu-architecture

Pet*_*des

2018 03-29

53
推荐指数

3
解决办法

6096
查看次数

NASM:计算32位数中的多少位设置为1

我有一个32位数字,想知道有多少位是1.

我在考虑这个伪代码:

mov eax, [number]
while(eax != 0)
{
  div eax, 2
  if(edx == 1)
  {
   ecx++;
  } 
  shr eax, 1
}

Run Code Online (Sandbox Code Playgroud)

有更有效的方法吗？

我在x86处理器上使用NASM.

(我刚开始使用汇编程序,所以请不要告诉我使用extern库中的代码,因为我甚至不知道如何包含它们;))

(我刚刚发现如何计算32位整数中的设置位数？这也包含我的解决方案.还有其他解决方案,但不幸的是我似乎无法弄清楚,我将如何在汇编程序中编写它们)

x86 assembly bit-manipulation nasm

cit*_*nas

2017 05-23

4
推荐指数

3
解决办法

9716
查看次数

如何检查 x86 程序集中是否设置了多个位？

我正在编写一个 x86 汇编程序，我想检查一个寄存器（它不是 0），看看是否有多个位打开。

有没有一种简单的方法可以做到这一点，或者我应该循环并移动直到看到第二组位或到达末尾？

我不需要设置位的总数，那就是

有没有比执行其中一项并检查更快的方法popcnt(x) > 1？

binary x86 assembly bit-manipulation bit

Que*_*ous

2022 06-17

3
推荐指数

1
解决办法

472
查看次数

标签统计

assembly ×3

bit-manipulation ×3

x86 ×3

binary ×2

algorithm ×1

bit ×1

cpu-architecture ×1

hammingweight ×1

iec10967 ×1

intel ×1

nasm ×1

performance ×1

如何计算32位整数中的设置位数？

为什么循环指令慢？英特尔无法有效实施吗？

NASM:计算32位数中的多少位设置为1

如何检查 x86 程序集中是否设置了多个位？

标签 统计

标签统计