我想使用bts和bt x86汇编指令来加速Mac上C++代码中的位操作.在Windows上,_bittestandset和_bittest内在函数运行良好,并提供显着的性能提升.在Mac上,gcc编译器似乎不支持这些,所以我试图直接在汇编程序中执行它.
这是我的C++代码(注意'bit'可以> = 32):
typedef unsigned long LongWord;
#define DivLongWord(w) ((unsigned)w >> 5)
#define ModLongWord(w) ((unsigned)w & (32-1))
inline void SetBit(LongWord array[], const int bit)
{
array[DivLongWord(bit)] |= 1 << ModLongWord(bit);
}
inline bool TestBit(const LongWord array[], const int bit)
{
return (array[DivLongWord(bit)] & (1 << ModLongWord(bit))) != 0;
}
Run Code Online (Sandbox Code Playgroud)
以下汇编程序代码可以工作,但不是最优的,因为编译器无法优化寄存器分配:
inline void SetBit(LongWord* array, const int bit)
{
__asm {
mov eax, bit
mov ecx, array
bts [ecx], eax
}
}
Run Code Online (Sandbox Code Playgroud)
问题:如何使编译器完全优化bts指令?如何用bt指令替换TestBit?
我试图用白色而不是黑色绘制标准的NSImage.以下适用于在当前NSGraphicsContext中以黑色绘制图像:
NSImage* image = [NSImage imageNamed:NSImageNameEnterFullScreenTemplate];
[image drawInRect:r fromRect:NSZeroRect operation:NSCompositeSourceOver fraction:1.0];
Run Code Online (Sandbox Code Playgroud)
我希望NSCompositeXOR可以做到这一点,但不是.我是否需要沿着复杂的[CIFilter filterWithName:@"CIColorInvert"]路径走下去?我觉得我一定会错过一些简单的东西.
安德斯
macos ×2
assembly ×1
c++ ×1
drawing ×1
gcc ×1
invert ×1
nsimage ×1
objective-c ×1
performance ×1