相关疑难解决方法(0)

我创建了一个使用SIMD进行64位*64位到128位的功能.目前我已经使用SSE2(acutally SSE4.1)实现了它.这意味着它可以同时运行两个64b*64b到128b的产品.同样的想法可以扩展到AVX2或AVX512,同时提供四个或八个64b*64到128b的产品.我的算法基于http://www.hackersdelight.org/hdcodetxt/muldws.c.txt

该算法进行一次无符号乘法,一次有符号乘法和两次有符号*无符号乘法.签名的*signed和unsigned*unsigned操作很容易使用_mm_mul_epi32和_mm_mul_epu32.但混合签名和未签名的产品给我带来了麻烦.例如,考虑一下.

int32_t x = 0x80000000;
uint32_t y = 0x7fffffff;
int64_t z = (int64_t)x*y;

Run Code Online (Sandbox Code Playgroud)

双字产品应该是0xc000000080000000.但是如果你假设你的编译器知道如何处理混合类型,你怎么能得到这个呢？这就是我想出的:

int64_t sign = x<0; sign*=-1;        //get the sign and make it all ones
uint32_t t = abs(x);                 //if x<0 take two's complement again
uint64_t prod = (uint64_t)t*y;       //unsigned product
int64_t z = (prod ^ sign) - sign;    //take two's complement based on the sign

Run Code Online (Sandbox Code Playgroud)

使用SSE可以这样做

__m128i xh;    //(xl2, xh2, xl1, xh1) high is signed, low unsigned
__m128i …

Run Code Online (Sandbox Code Playgroud)

c x86 integer sse bit-manipulation

Z b*_*son

2016 12-28

9
推荐指数

2
解决办法

4203
查看次数

Visual C++ x64附带进位

因为似乎没有ADC的固有内容而且我不能使用Visual C++的x64架构使用内联汇编程序,如果我想使用add with carry编写函数但是将它包含在C++命名空间中,我该怎么办？

(使用比较运算符进行仿真不是一种选择.这256兆位的添加对性能至关重要.)

c++ 64-bit inline-assembly intrinsics visual-c++

jnm*_*nm2

2012 02-12

7
推荐指数

2
解决办法

2682
查看次数

SSE乘以2个64位整数

如何将两个64位整数乘以另外两个64位整数？我没有找到任何可以做到的指令.

x86 sse simd multiplication sse2

Ine*_*ani

lucky-day

7
推荐指数

3
解决办法

2857
查看次数

标签统计

sse ×3

assembly ×2

c ×2

sse2 ×2

x86 ×2

64-bit ×1

bit-manipulation ×1

c++ ×1

inline-assembly ×1

integer ×1

intrinsics ×1

multiplication ×1

performance ×1

simd ×1

visual-c++ ×1

什么时候装配比C快？

是否可以使用SSE和SSE2来生成128位宽的整数？

SIMD使用无符号乘法对64位*64位到128位进行签名

Visual C++ x64附带进位

SSE乘以2个64位整数

标签 统计

标签统计