在 numba 中编译 abs() 比普通的 python 函数慢

nye*_*nyu 1 python numba jupyter-notebook

这一切都是在 jupyter notebook 中编程的,但是我在“正常”终端/空闲工作空间中没有发现不同的结果。我发现运行这个函数:

def __difference(a,b):
    return abs(a,b)
Run Code Online (Sandbox Code Playgroud)

始终比以下更快:

@jit(nopython=True)
def __difference_numba(a,b):
    return abs(a,b)
Run Code Online (Sandbox Code Playgroud)

编译的函数,这是 __difference_numba.inspect_types() 的输出(我的输入在两种情况下都是两个浮点数):

__difference_numba (float64, float64)
--------------------------------------------------------------------------------
# File: <ipython-input-50-f6f52d4cccbf>
# --- LINE 1 --- 
# label 0

@jit(nopython=True)

# --- LINE 2 --- 

def __difference_numba(a, b):

# --- LINE 3 --- 
#   a = arg(0, name=a)  :: float64
#   b = arg(1, name=b)  :: float64
#   $0.1 = global(abs: <built-in function abs>)  :: Function(<built-in function abs>)
#   $0.4 = a - b  :: float64
#   del b
#   del a
#   $0.5 = call $0.1($0.4, kws=[], vararg=None, args=[Var($0.4, <ipython-input-50-f6f52d4cccbf> (3))], func=$0.1)  :: (float64,) -> float64
#   del $0.4
#   del $0.1
#   $0.6 = cast(value=$0.5)  :: float64
#   del $0.5
#   return $0.6

return abs(a-b)#np.abs(a - b)

=============================================================================
Run Code Online (Sandbox Code Playgroud)

使用 timeit 来计时函数的代码:

单元格定义参数(我尝试了不同的数字):

#test parameters
a=5.0
b=-2.5
Run Code Online (Sandbox Code Playgroud)

用于测试 numba 实现和结果的单元格:

%%timeit
#test numba

__difference_numba(a,b)

239 ns ± 6.03 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
Run Code Online (Sandbox Code Playgroud)

用于测试正常 python 实现和结果的单元格:

%%timeit
#test python

__difference(a,b)

156 ns ± 0.823 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
Run Code Online (Sandbox Code Playgroud)

Jos*_*del 5

我相信你看到的是调度到 numba 代码的开销(而不是编译abs函数的速度),因为在函数中完成的工作是如此微不足道。

通常,您不会将这样的简单调用分离到函数中,尽管_difference_numba从另一个 numba-jitted 函数中调用可能会被编译器内联。无论哪种方式,您都需要在 numba 代码中停留比开销更长的时间,才能开始看到纯 python 代码和 numba-jitted 代码之间的性能差异。像这样在 numba/python 边界上来回调用不会克服开销。