如何在Cython中动态声明2D c数组

phi*_*thy 6 c numpy cython dynamic-arrays memoryview

我需要使用各种大小的2D numpy数组执行大量工作,我想将这些计算卸载到cython上.我的想法是我的2D numpy数组将从python传递到cython,在那里它将转换为c-array或内存视图,并用于其他c级函数的级联中进行计算.

经过一些分析后,由于一些严重的python开销,我排除了在cython中使用numpy数组.使用内存视图更快,更容易使用,但我怀疑我可以使用c-arrays进一步加速.

这是我的问题 - 我怎样才能在cython中声明一个2D c-array而不用设定值预定义它的尺寸?例如,我可以通过这种方式从numpy创建一个c-array:

narr = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]], dtype=np.dtype("i"))

cdef int c_arr[3][4]:
for i in range(3):
    for j in range(4):
        c_arr[i][j] = narr[i][j]
Run Code Online (Sandbox Code Playgroud)

然后将其传递给函数:

cdef void somefunction(int c_Arr[3][4]):
    ...
Run Code Online (Sandbox Code Playgroud)

但这意味着我有一个固定的数组sizde,在我的情况下将是无用的.所以我尝试过这样的事情:

narr = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]], dtype=np.dtype("i"))

cdef int a = np.shape(narr)[0]
cdef int b = np.shape(narr)[1]

cdef int c_arr[a][b]:               # INCORRECT - EXAMPLE ONLY

for i in range(a):
    for j in range(b):
        c_arr[i][j] = narr[i][j]
Run Code Online (Sandbox Code Playgroud)

打算将它传递给这样的函数:

cdef void somefunction(int a, int b, int c_Arr[a][b]):
    ...
Run Code Online (Sandbox Code Playgroud)

但它不起作用,编译失败,错误"不允许在常量表达式中".我怀疑我需要以某种方式使用malloc/free吗?我看了一下这个问题(如何在Cython中声明2D列表),但它没有提供我的问题的答案.

更新:

事实证明,如果确保在内存视图中关闭cython中的indexError检查,则内存视图可以与c数组一样快,这可以通过使用cython编译器指令来完成:

# cython: boundscheck=False
Run Code Online (Sandbox Code Playgroud)

谢谢@Veedrac的小费!

Vee*_*rac 7

你只需要停止边界检查:

with cython.boundscheck(False):
    thesum += x_view[i,j]
Run Code Online (Sandbox Code Playgroud)

这使得速度基本上达到了标准杆.


如果您真的想要一个C数组,请尝试:

import numpy as numpy
from numpy import int32
from numpy cimport int32_t

numpy_array = numpy.array([[]], dtype=int32)

cdef:
    int32_t[:, :] cython_view = numpy_array
    int32_t *c_integers_array = &cython_view[0, 0]
    int32_t[4] *c_2d_array = <int32_t[4] *>c_integers_array
Run Code Online (Sandbox Code Playgroud)

首先你得到一个Numpy数组.您可以使用它来获取内存视图.然后你得到一个指向它的数据的指针,你可以将它转换成所需步幅的指针.