相关疑难解决方法(0)

对于这个简单的循环，为什么 cython 比 numba 慢得多？

我有一个简单的循环，仅对 numpy 数组的第二行求和。在 numba 我只需要做：

from numba import njit\n@njit(\'float64(float64[:, ::1])\', fastmath=True)\n    def fast_sum_nb(array_2d):\n        s = 0.0\n        for i in range(array_2d.shape[1]):\n            s += array_2d[1, i]\n        return s\n

Run Code Online (Sandbox Code Playgroud)\n

如果我对代码进行计时，我会得到：

In [3]: import numpy as np\nIn [4]: A = np.random.rand(2, 1000)\nIn [5]: %timeit fast_sum_nb(A)\n305 ns \xc2\xb1 7.81 ns per loop (mean \xc2\xb1 std. dev. of 7 runs, 1,000,000 loops each)\n

Run Code Online (Sandbox Code Playgroud)\n

要在 cython 中执行相同的操作，我需要首先 make setup.py ，其中包含：

from setuptools import setup\nfrom Cython.Build import cythonize\nfrom setuptools.extension import Extension\n\next_modules = [\n …

Run Code Online (Sandbox Code Playgroud)

python gcc clang cython numba

Rap*_*ael

2023 06-06

5
推荐指数

2
解决办法

726
查看次数

在 Cython 中循环二维数组的最快方法

我正在尝试在 Cython 中循环 2 个 2d 数组。数组具有以下形状： ranges_1是的 6000x3 数组int64，而ranges_2是的 2000x2 数组int64。这个迭代需要执行10000次左右。这意味着嵌套 for 循环内的计算总数约为 2000x6000x10000 = 1200 亿次。

这是我用来生成“虚拟”数据的代码：

import numpy as np
ranges_1 = np.stack([np.random.randint(0, 10_000, 6_000), np.random.randint(0, 10_000, 6_000), np.arange(0, 6_000)], axis=1)
ranges_2 = np.stack([np.random.randint(0, 10_000, 2_000), np.random.randint(0, 10_000, 2_000)], axis=1)

Run Code Online (Sandbox Code Playgroud)

这给出了 2 个像这样的数组：

array([[6131, 1478,    0],
       [9317, 7263,    1],
       [7938, 6249,    2],
       ...,
       [5153,  426, 5997],
       [9164, 9211, 5998],
       [1695, 1792, 5999]])

Run Code Online (Sandbox Code Playgroud)

和：

array([[ 433,  558],
       [3420, 2494], …

Run Code Online (Sandbox Code Playgroud)

python optimization performance cython

Fab*_*zio

lucky-day

0
推荐指数

1
解决办法

320
查看次数

标签统计

cython ×2

python ×2

clang ×1

gcc ×1

numba ×1

optimization ×1

performance ×1

对于这个简单的循环，为什么 cython 比 numba 慢得多？

在 Cython 中循环二维数组的最快方法

标签 统计

标签统计