熊猫数据框多行查询

gio*_*c88 9 python multiline python-3.x pandas python-3.6

说我有一个数据框

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
Run Code Online (Sandbox Code Playgroud)

如果我现在尝试使用以下query方法查询它:

这有效:

df.query('''a > 3 and b < 9''')

这会引发错误:

df.query(
    '''
        a > 3 and
        b < 9
    '''
)
Run Code Online (Sandbox Code Playgroud)

我尝试了多行字符串的许多变体,但结果总是以下错误:

~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace)
    306     if multi_line and target is None:
    307         raise ValueError(
--> 308             "multi-line expressions are only valid in the "
    309             "context of data, use DataFrame.eval"
    310         )

ValueError: multi-line expressions are only valid in the context of data, use DataFrame.eval
Run Code Online (Sandbox Code Playgroud)

有谁知道如何使它工作?问题是,实际上我有一个很长的查询要做,并且必须在一行中写出所有内容会非常不方便。我知道我可以使用布尔索引来代替,但我的问题只是关于如何在该query方法中使用多行。

谢谢

Rak*_*esh 11

使用多行字符反斜杠 ( \)

前任:

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
print(df.query(
    '''
        a > 3 and \
        b < 9
    '''
))
Run Code Online (Sandbox Code Playgroud)