内置"in"运算符的Python源代码

Mic*_*ael 9 c python string cpython python-internals

我试图in在(C)Python源代码中找到内置运算符的实现.我在内置函数源代码bltinmodule.c中搜索过,但是找不到这个运算符的实现.我在哪里可以找到这个实现?

我的目标是通过扩展此搜索的不同C实现来改进Python中的子字符串搜索,尽管我不确定Python是否已经使用了我的想法.

Mar*_*ers 31

要找到任何 python运算符的实现,首先要找到Python为它生成的字节码,使用以下dis.dis函数:

>>> dis.dis("'0' in ()")
  1           0 LOAD_CONST               0 ('0')
              2 LOAD_CONST               1 (())
              4 COMPARE_OP               6 (in)
              6 RETURN_VALUE
Run Code Online (Sandbox Code Playgroud)

in运营商变成了COMPARE_OP字节码.现在,您可以在Python评估循环中跟踪如何处理此操作码Python/ceval.c:

TARGET(COMPARE_OP)
    PyObject *right = POP();
    PyObject *left = TOP();
    PyObject *res = cmp_outcome(oparg, left, right);
    Py_DECREF(left);
    Py_DECREF(right);
    SET_TOP(res);
    if (res == NULL)
        goto error;
    PREDICT(POP_JUMP_IF_FALSE);
    PREDICT(POP_JUMP_IF_TRUE);
    DISPATCH();
Run Code Online (Sandbox Code Playgroud)

cmp_outcome()在相同的文件中定义,并且in操作者是开关中的一个:

case PyCmp_IN:
    res = PySequence_Contains(w, v);
    if (res < 0)
         return NULL;
    break;
Run Code Online (Sandbox Code Playgroud)

快速grep向我们展示PySequence_ContainsObjects/abstract.c中定义的位置:

int
PySequence_Contains(PyObject *seq, PyObject *ob)
{
    Py_ssize_t result;
    PySequenceMethods *sqm = seq->ob_type->tp_as_sequence;
    if (sqm != NULL && sqm->sq_contains != NULL)
        return (*sqm->sq_contains)(seq, ob);
    result = _PySequence_IterSearch(seq, ob, PY_ITERSEARCH_CONTAINS);
    return Py_SAFE_DOWNCAST(result, Py_ssize_t, int);
}
Run Code Online (Sandbox Code Playgroud)

PySequence_Contains因此,对于Python C对象,使用sq_containsSequence对象结构上或迭代搜索.

对于Python 3 Unicode字符串对象,此插槽PyUnicode_Contains在Objects/unicodeobject.c中实现,在Python 2中,您还需要string_contains在Objects/stringobject.c中查看.基本上只需要sq_contains在Objects /子目录中使用不同的Python类型进行各种实现的grep .

对于通用python对象,有趣的是注意到Objects/typeobject.c将此推迟到__contains__自定义类的方法(如果已定义).