相关疑难解决方法(0)

按位运算符的真实世界用例

以下按位运算符的一些实际用例是什么？

和
XOR
不
要么

language-agnostic bitwise-operators

Oli*_*nde

2012 05-03

217
推荐指数

17
解决办法

8万
查看次数

为什么GCC在实现整数除法时使用乘以奇数的乘法？

我一直在阅读div和mul组装操作,我决定通过在C中编写一个简单的程序来实现它们:

文件分割

#include <stdlib.h>
#include <stdio.h>

int main()
{
    size_t i = 9;
    size_t j = i / 5;
    printf("%zu\n",j);
    return 0;
}

Run Code Online (Sandbox Code Playgroud)

然后生成汇编语言代码:

gcc -S division.c -O0 -masm=intel

Run Code Online (Sandbox Code Playgroud)

但是看生成的division.s文件,它不包含任何div操作!相反,它通过位移和魔术数字来做某种黑魔法.这是一个计算代码片段i/5:

mov     rax, QWORD PTR [rbp-16]   ; Move i (=9) to RAX
movabs  rdx, -3689348814741910323 ; Move some magic number to RDX (?)
mul     rdx                       ; Multiply 9 by magic number
mov     rax, rdx                  ; Take only the upper 64 bits of the …

Run Code Online (Sandbox Code Playgroud)

c assembly gcc x86-64 integer-division

qiu*_*bit

2016 12-18

206
推荐指数

4
解决办法

1万
查看次数

按位运算的实际应用

你有什么用bitwise操作？
他们为什么这么方便？
有人可以推荐一个非常简单的教程吗？

c# bitwise-operators

l--*_*'''

lucky-day

73
推荐指数

4
解决办法

3万
查看次数

Is a logical right shift by a power of 2 faster in AVR?

I would like to know if performing a logical right shift is faster when shifting by a power of 2

For example, is

myUnsigned >> 4

Run Code Online (Sandbox Code Playgroud)

any faster than

myUnsigned >> 3

Run Code Online (Sandbox Code Playgroud)

我很欣赏每个人的第一反应是告诉我,人们不应该担心像这样的小事,它使用正确的算法和集合来减少重要的数量级.我完全同意你的意见,但我真的想从嵌入式芯片(ATMega328)中挤出所有东西 - 我只是有一个性能转变,值得'哇喔!' 通过用位移替换除法,所以我向你保证这很重要.

c++ optimization avr atmega bit-shift

Wil*_*ill

2018 08-10

7
推荐指数

2
解决办法

5293
查看次数

位移位的实际应用

我完全理解如何移位。我已经在纸上和代码中完成了许多示例，并且不需要任何帮助。

我正在尝试提出一些有关如何使用位移的真实示例。以下是我能想到的一些例子：

也许我能概念化的最重要的例子与字节序有关。在大端系统中，最低有效位从左侧存储，而在小端系统中，最低有效位从右侧存储。我想对于使用相反字节序策略的系统之间的文件和网络传输，必须进行某些转换。
在处理任何 n^2、n^4 等乘法时，编译器和处理器似乎可以进行某些优化。这些位只是向左移动。（相反，我想同样适用于除法、n/2、n/4 等）
在加密算法中。即使用一系列位移、反转和组合来混淆某些东西。

所有这些都是准确的例子吗？你有什么要补充的吗？我花了很多时间学习如何实现位移/重新排序/字节交换，我想知道如何实际应用它 = )

c bits bit-shift

Cal*_*dge

lucky-day

5
推荐指数

1
解决办法

1768
查看次数

python为什么不能向量化map（）或列表推导

我对向量化了解不多，但是我想了解为什么像python这样的语言无法通过库接口在可迭代对象上提供向量化，就像它提供线程支持一样。我知道许多numpy方法都是矢量化的，但是对于通用计算必须使用numpy可能会受到限制。

我目前的理解是，即使python与“ SIMD”模式匹配，它们也无法向量化它们。例如，理论上不应该对列表的理解或对该map()函数的使用进行矢量化处理，因为它们会输出一个列表，这是对来自输入列表的独立输入运行相同功能的结果吗？

凭着我的敏锐理解，似乎map()从理论上讲，无论何时我使用，我都应该能够创建一个代表该功能的指令集。那么输入中的每个元素只需通过已编译的同一函数运行即可。设计一种工具的技术挑战是什么，该工具会simd_map(func, iterable)尝试func“及时” 编译，然后从iterable处理器中提取批输入并利用处理器的simd功能来运行这些批处理func()？

谢谢！

python parallel-processing simd vectorization python-multiprocessing

Sci*_*Guy

lucky-day

1
推荐指数

1
解决办法

78
查看次数