Ede*_*nor 3 implementation numpy absolute go
我正在尝试为 Go 中的 gonum 密集向量实现我自己的绝对函数。我在徘徊是否有比平方然后平方根更好的获取数组绝对值的方法?
我的主要问题是我必须在这些向量上实现我自己的元素明智的牛顿平方根函数,并且在实现速度和准确性之间取得平衡。如果我可以避免使用这个平方根函数,我会很高兴。
NumPy 源代码可能很难导航,因为它具有适用于多种数据类型的多种功能。您可以在文件中找到绝对值函数的 C 级源代码scalarmath.c.src
。这个文件实际上是一个带有函数定义的模板,稍后由构建系统为几种数据类型复制。请注意,每个函数都是为数组的每个元素运行的“内核”(遍历数组在其他地方完成)。这些函数总是被调用<name of the type>_ctype_absolute
,<name of the type>
它适用的数据类型在哪里,通常是模板化的。让我们通过它们。
/**begin repeat
* #name = ubyte, ushort, uint, ulong, ulonglong#
*/
#define @name@_ctype_absolute @name@_ctype_positive
/**end repeat**/
Run Code Online (Sandbox Code Playgroud)
这是用于无符号类型的。在这种情况下,绝对值与 相同np.positive
,它只是复制值而不做任何事情(如果你有一个数组a
并且你做了,这就是你得到的+a
)。
/**begin repeat
* #name = byte, short, int, long, longlong#
* #type = npy_byte, npy_short, npy_int, npy_long, npy_longlong#
*/
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
*out = (a < 0 ? -a : a);
}
/**end repeat**/
Run Code Online (Sandbox Code Playgroud)
这是用于有符号整数。很简单。
/**begin repeat
* #name = float, double, longdouble#
* #type = npy_float, npy_double, npy_longdouble#
* #c = f,,l#
*/
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
*out = npy_fabs@c@(a);
}
/**end repeat**/
Run Code Online (Sandbox Code Playgroud)
这是用于浮点值。这里使用npy_fabsf
,npy_fabs
和npy_fabsl
函数。它们在 中声明npy_math.h
,但通过 中的模板化 C 代码定义npy_math_internal.h.src
,本质上调用C/C99 对应物(除非 C99 不可用,在这种情况下fabsf
并fabsl
用 模拟fabs
)。你可能认为前面的代码应该也适用于浮点类型,但实际上这些更复杂,因为它们有 NaN、无穷大或有符号零之类的东西,所以最好使用处理所有事情的标准 C 函数可靠。
static void
half_ctype_absolute(npy_half a, npy_half *out)
{
*out = a&0x7fffu;
}
Run Code Online (Sandbox Code Playgroud)
这实际上不是模板化的,它是半精度浮点值的绝对值函数。事实证明,您可以通过按位运算(将第一位设置为 0)来更改符号,因为半精度比其他浮点类型更简单(如果有更多限制)(它们通常相同,但有特殊情况) )。
/**begin repeat
* #name = cfloat, cdouble, clongdouble#
* #type = npy_cfloat, npy_cdouble, npy_clongdouble#
* #rtype = npy_float, npy_double, npy_longdouble#
* #c = f,,l#
*/
static void
@name@_ctype_absolute(@type@ a, @rtype@ *out)
{
*out = npy_cabs@c@(a);
}
/**end repeat**/
Run Code Online (Sandbox Code Playgroud)
最后一个用于复杂类型。这些使用npy_cabsf
,npycabs
和npy_cabsl
函数,再次声明,npy_math.h
但在这种情况下,npy_math_complex.c.src
使用C99 函数模板实现(除非它不可用,在这种情况下,它是用模拟的np.hypot
)。