Cython:内联函数不是纯C

bio*_*ios 6 python optimization inline cython

我有Cython的以下内联函数

cpdef inline int c_rate2recs_2(int maxNN,int idx):
  cdef int out=idx%maxNN
  return out
Run Code Online (Sandbox Code Playgroud)

然而,这转化为

/* 
 *   return out
 * 
 * cpdef inline int c_rate2recs_2(int maxNN,int idx):             # <<<<<<<<<<<<<<
 *   cdef int out=idx%maxNN
 *   return out
 */

static PyObject *__pyx_pw_6kmc_cy_5c_rate2recs_2(PyObject *__pyx_self, PyObject *__pyx_args, PyObject *__pyx_kwds); /*proto*/
static CYTHON_INLINE int __pyx_f_6kmc_cy_c_rate2recs_2(int __pyx_v_maxNN, int __pyx_v_idx, CYTHON_UNUSED int __pyx_skip_dispatch) {
  int __pyx_v_out;
  int __pyx_r;
  __Pyx_TraceDeclarations
  __Pyx_RefNannyDeclarations
  __Pyx_RefNannySetupContext("c_rate2recs_2", 0);
  __Pyx_TraceCall("c_rate2recs_2", __pyx_f[0], 984);

/* 
 *   return out
 * 
 * cpdef inline int c_rate2recs_2(int maxNN,int idx):             # <<<<<<<<<<<<<<
 *   cdef int out=idx%maxNN
 *   return out
 */

static PyObject *__pyx_pf_6kmc_cy_4c_rate2recs_2(CYTHON_UNUSED PyObject *__pyx_self, int __pyx_v_maxNN, int __pyx_v_idx) {
  PyObject *__pyx_r = NULL;
  __Pyx_TraceDeclarations
  __Pyx_RefNannyDeclarations
  __Pyx_RefNannySetupContext("c_rate2recs_2", 0);
  __Pyx_TraceCall("c_rate2recs_2", __pyx_f[0], 984);
  __Pyx_XDECREF(__pyx_r);
  __pyx_t_1 = PyInt_FromLong(__pyx_f_6kmc_cy_c_rate2recs_2(__pyx_v_maxNN, __pyx_v_idx, 0)); if (unlikely(!__pyx_t_1)) {__pyx_filename = __pyx_f[0]; __pyx_lineno = 984; __pyx_clineno = __LINE__; goto __pyx_L1_error;}
  __Pyx_GOTREF(__pyx_t_1);
  __pyx_r = __pyx_t_1;
  __pyx_t_1 = 0;
  goto __pyx_L0;

  __pyx_r = Py_None; __Pyx_INCREF(Py_None);
  goto __pyx_L0;
  __pyx_L1_error:;
  __Pyx_XDECREF(__pyx_t_1);
  __Pyx_AddTraceback("kmc_cy.c_rate2recs_2", __pyx_clineno, __pyx_lineno, __pyx_filename);
  __pyx_r = NULL;
  __pyx_L0:;
  __Pyx_XGIVEREF(__pyx_r);
  __Pyx_TraceReturn(__pyx_r);
  __Pyx_RefNannyFinishContext();
  return __pyx_r;
}
Run Code Online (Sandbox Code Playgroud)

由于我是cython业务的新手,我想知道如何摆脱大多数Python命令(cython -a将此内联标记为远离纯C).

Vee*_*rac 5

由于我是 cython 业务的新手,我想知道如何摆脱大多数 python 命令(cython -a 将此内联标记为与纯 C 相去甚远)

诀窍在于,如果你可以调用你的函数nogil

cpdef inline int c_rate2recs_2(int maxNN,int idx) nogil:
  cdef int out=idx%maxNN
  return out
Run Code Online (Sandbox Code Playgroud)

那么无论你看到什么黄色,实际上通常都不会进入Python。例如,这可能是一个错误情况,也可能只是其他类型的温和检查。对于 a cpdef,不仅创建了一个纯 C 函数,还创建了一个 Python 别名以便从 Python 作用域进行调用。这不会影响速度。

在这种情况下,针对手动内联循环的一些计时没有显示出速度减慢,并且删除inline对时间也没有任何作用。我想一个更难优化的案例可能会表现出不同的特征,但关键是分析

最后,可以通过使用编译器指令来加快速度并消除一些错误检查。