为什么整数指数的numpy.power较慢?

Dil*_*rix 8 python performance types numpy exponentiation

我随机选择了这些数字,但这些结果似乎是一致的 - 浮点指数比整数指数快25%-50%.这些处理方式有何不同?

In [209]: %timeit -n 100000 -r 100 np.power(3.71242, 7)
100000 loops, best of 100: 3.45 µs per loop

In [210]: %timeit -n 100000 -r 100 np.power(3.71242, 7.0)
100000 loops, best of 100: 1.98 µs per loop
Run Code Online (Sandbox Code Playgroud)

Ale*_*ley 14

np.power是一个通用函数(ufunc).这些函数可用于具有各种不同数据类型的标量和数组,但必须首先检查输入值的类型,以便它们可以确定使用哪个内部循环来生成合适的输出值.

如果输入类型没有映射到任何ufunc的预定义循环,则ufunc将尝试将输入值强制转换为合适的类型(除非另有说明).这种输入值的检查和转换具有与之相关的性能成本,解释了在问题中观察到的时序.

typesufunc 的属性显示输入数据类型将如何映射到输出数据类型.以下是映射列表np.power:

>>> np.power.types # 'input input -> output'
['bb->b', 'BB->B', 'hh->h', 'HH->H', 'ii->i', 'II->I', 'll->l', 'LL->L', 'qq->q', 
 'QQ->Q', 'ee->e', 'ff->f', 'dd->d', 'gg->g', 'FF->F', 'DD->D', 'GG->G', 'OO->O']
Run Code Online (Sandbox Code Playgroud)

浮点数属于字符代码'g',Python整数属于'l'.这里可以找到这些字符代码的完整列表.

请注意,对于此ufunc,两个输入值的数据类型必须相同.例如,没有混合floatint输入数据类型的映射.

但我们仍然可以提供np.power不同的数据类型,并让它将值转换为适当的数据类型.对于a float和an int,float64返回一个数字:

>>> np.power(3.71242, 7).dtype
dtype('float64')
Run Code Online (Sandbox Code Playgroud)

上面你可以看到映射到float64字符代码的唯一输入g是另外两个g值:'gg->g'.

所以,在幕后,np.power(3.71242, 7)拿了一个Python float和一个Python int,不得不决定它可以安全地重铸哪个类型.该int值安全地提升为浮点类型g.然后ufunc知道要运行哪个循环并返回另一个g值.

因此,不混合输入数据类型会带来更好的性能np.power.