在 numba 中编译 abs() 比普通的 python 函数慢

Question

在 numba 中编译 abs() 比普通的 python 函数慢

nye*_*nyu 1 python numba jupyter-notebook

这一切都是在 jupyter notebook 中编程的，但是我在“正常”终端/空闲工作空间中没有发现不同的结果。我发现运行这个函数：

def __difference(a,b):
    return abs(a,b)

Run Code Online (Sandbox Code Playgroud)

始终比以下更快：

@jit(nopython=True)
def __difference_numba(a,b):
    return abs(a,b)

Run Code Online (Sandbox Code Playgroud)

编译的函数，这是 __difference_numba.inspect_types() 的输出（我的输入在两种情况下都是两个浮点数）：

__difference_numba (float64, float64)
--------------------------------------------------------------------------------
# File: <ipython-input-50-f6f52d4cccbf>
# --- LINE 1 --- 
# label 0

@jit(nopython=True)

# --- LINE 2 --- 

def __difference_numba(a, b):

# --- LINE 3 --- 
#   a = arg(0, name=a)  :: float64
#   b = arg(1, name=b)  :: float64
#   $0.1 = global(abs: <built-in function abs>)  :: Function(<built-in function abs>)
#   $0.4 = a - b  :: float64
#   del b
#   del a
#   $0.5 = call $0.1($0.4, kws=[], vararg=None, args=[Var($0.4, <ipython-input-50-f6f52d4cccbf> (3))], func=$0.1)  :: (float64,) -> float64
#   del $0.4
#   del $0.1
#   $0.6 = cast(value=$0.5)  :: float64
#   del $0.5
#   return $0.6

return abs(a-b)#np.abs(a - b)

=============================================================================

Run Code Online (Sandbox Code Playgroud)

使用 timeit 来计时函数的代码：

单元格定义参数（我尝试了不同的数字）：

#test parameters
a=5.0
b=-2.5

Run Code Online (Sandbox Code Playgroud)

用于测试 numba 实现和结果的单元格：

%%timeit
#test numba

__difference_numba(a,b)

239 ns ± 6.03 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

Run Code Online (Sandbox Code Playgroud)

用于测试正常 python 实现和结果的单元格：

%%timeit
#test python

__difference(a,b)

156 ns ± 0.823 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

Run Code Online (Sandbox Code Playgroud)

Answer 1

Jos*_*del 5

我相信你看到的是调度到 numba 代码的开销（而不是编译abs函数的速度），因为在函数中完成的工作是如此微不足道。

通常，您不会将这样的简单调用分离到函数中，尽管_difference_numba从另一个 numba-jitted 函数中调用可能会被编译器内联。无论哪种方式，您都需要在 numba 代码中停留比开销更长的时间，才能开始看到纯 python 代码和 numba-jitted 代码之间的性能差异。像这样在 numba/python 边界上来回调用不会克服开销。

归档时间：	7 年，9 月前
查看次数：	402 次
最近记录：	7 年，9 月前