小编sma*_*tgo的帖子

使用bts汇编指令和gcc编译器

我想使用bts和bt x86汇编指令来加速Mac上C++代码中的位操作.在Windows上,_bittestandset和_bittest内在函数运行良好,并提供显着的性能提升.在Mac上,gcc编译器似乎不支持这些,所以我试图直接在汇编程序中执行它.

这是我的C++代码(注意'bit'可以> = 32):

typedef unsigned long LongWord;
#define DivLongWord(w) ((unsigned)w >> 5)
#define ModLongWord(w) ((unsigned)w & (32-1))

inline void SetBit(LongWord array[], const int bit)
{
   array[DivLongWord(bit)] |= 1 << ModLongWord(bit);
}

inline bool TestBit(const LongWord array[], const int bit)
{
    return (array[DivLongWord(bit)] & (1 << ModLongWord(bit))) != 0;
}
Run Code Online (Sandbox Code Playgroud)

以下汇编程序代码可以工作,但不是最优的,因为编译器无法优化寄存器分配:

inline void SetBit(LongWord* array, const int bit)
{
   __asm {
      mov   eax, bit
      mov   ecx, array
      bts   [ecx], eax
   }
}
Run Code Online (Sandbox Code Playgroud)

问题:如何使编译器完全优化bts指令?如何用bt指令替换TestBit?

c++ macos performance assembly gcc

5
推荐指数
2
解决办法
4412
查看次数

绘制标准NSImage倒置(白色而不是黑色)

我试图用白色而不是黑色绘制标准的NSImage.以下适用于在当前NSGraphicsContext中以黑色绘制图像:

NSImage* image = [NSImage imageNamed:NSImageNameEnterFullScreenTemplate];
[image drawInRect:r fromRect:NSZeroRect operation:NSCompositeSourceOver fraction:1.0];
Run Code Online (Sandbox Code Playgroud)

我希望NSCompositeXOR可以做到这一点,但不是.我是否需要沿着复杂的[CIFilter filterWithName:@"CIColorInvert"]路径走下去?我觉得我一定会错过一些简单的东西.

安德斯

macos drawing objective-c nsimage invert

3
推荐指数
1
解决办法
5834
查看次数

标签 统计

macos ×2

assembly ×1

c++ ×1

drawing ×1

gcc ×1

invert ×1

nsimage ×1

objective-c ×1

performance ×1