我不想优化任何东西,我发誓,我只想出于好奇而问这个问题.我知道,在大多数硬件有位移(例如的组件的命令shl,shr),它是一个命令.但是,你转移了多少比特(纳秒级,或CPU技巧)是否重要?换句话说,在任何CPU上是否更快?
x << 1;
Run Code Online (Sandbox Code Playgroud)
和
x << 10;
Run Code Online (Sandbox Code Playgroud)
请不要因为这个问题而恨我.:)
众所周知,乘法,整数除法和2的幂的模可以作为按位运算更有效地重写:
>>> x = randint(50000, 100000)
>>> x << 2 == x * 4
True
>>> x >> 2 == x // 4
True
>>> x & 3 == x % 4
True
Run Code Online (Sandbox Code Playgroud)
在诸如C/C++和Java等编译语言中,测试表明按位运算通常比算术运算更快.(见这里和这里).但是,当我在Python中测试这些时,我得到了相反的结果:
In [1]: from random import randint
...: nums = [randint(0, 1000000) for _ in range(100000)]
In [2]: %timeit [i * 8 for i in nums]
7.73 ms ± 397 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) …Run Code Online (Sandbox Code Playgroud) 我正在尝试将8位值复制到32位,并想问问是否有可能编写单行算法来复制位值。
例如:
1100 1011 -> 1111 1111 0000 0000 1111 0000 1111 1111
Run Code Online (Sandbox Code Playgroud)
如果有可能,我想了解其背后的逻辑。
要将一个数字乘以 2 的任意倍数,我将对其进行多次移位。
有没有这样的技术可以在更少的周期内将数字乘以 10?
是x>>2不是更快x>>31?换句话说,sar x, 2比sar x, 31? 我做了一些简单的测试,它们似乎具有相同的速度。我将不胜感激任何确凿的证据。
assembly ×2
c ×2
c++ ×2
performance ×2
cpu ×1
duplicates ×1
expansion ×1
low-level ×1
optimization ×1
python ×1
x86 ×1
x86-16 ×1