相关疑难解决方法(0)

我创建了一个使用SIMD进行64位*64位到128位的功能.目前我已经使用SSE2(acutally SSE4.1)实现了它.这意味着它可以同时运行两个64b*64b到128b的产品.同样的想法可以扩展到AVX2或AVX512,同时提供四个或八个64b*64到128b的产品.我的算法基于http://www.hackersdelight.org/hdcodetxt/muldws.c.txt

该算法进行一次无符号乘法,一次有符号乘法和两次有符号*无符号乘法.签名的*signed和unsigned*unsigned操作很容易使用_mm_mul_epi32和_mm_mul_epu32.但混合签名和未签名的产品给我带来了麻烦.例如,考虑一下.

int32_t x = 0x80000000;
uint32_t y = 0x7fffffff;
int64_t z = (int64_t)x*y;

Run Code Online (Sandbox Code Playgroud)

双字产品应该是0xc000000080000000.但是如果你假设你的编译器知道如何处理混合类型,你怎么能得到这个呢？这就是我想出的:

int64_t sign = x<0; sign*=-1;        //get the sign and make it all ones
uint32_t t = abs(x);                 //if x<0 take two's complement again
uint64_t prod = (uint64_t)t*y;       //unsigned product
int64_t z = (prod ^ sign) - sign;    //take two's complement based on the sign

Run Code Online (Sandbox Code Playgroud)

使用SSE可以这样做

__m128i xh;    //(xl2, xh2, xl1, xh1) high is signed, low unsigned
__m128i …

Run Code Online (Sandbox Code Playgroud)

c x86 integer sse bit-manipulation

Z b*_*son

2016 12-28

9
推荐指数

2
解决办法

4203
查看次数

32位有符号整数乘法,不使用64位数据类型

我想在不使用64位数据类型的情况下进行32位有符号整数乘法.我的输入是Q1.31(两种)格式.

input1 = A32 (Ah Al) - higher, lower half's of A32
input2 = B32 (Bh Bl) - higher, lower half's of B32

Run Code Online (Sandbox Code Playgroud)

结果应为Q1.31格式,保留溢出情况.

我需要C代码.请提供格式说明.

c signed integer bit-manipulation multiplication

jos*_*eph

2018 06-26

1
推荐指数

1
解决办法

2605
查看次数

标签统计

bit-manipulation ×3

c ×3

integer ×3

multiplication ×3

x86 ×2

64-bit ×1

assembly ×1

avx2 ×1

c++ ×1

floating-point ×1

fma ×1

overflow ×1

signed ×1

simd ×1

sse ×1

在两个大整数的乘法期间捕获并计算溢出

获得64位整数乘法的高分

我可以使用AVX FMA单元进行精确的52位整数乘法吗？

SIMD使用无符号乘法对64位*64位到128位进行签名

32位有符号整数乘法,不使用64位数据类型

标签 统计

标签统计