熊猫使用遮罩就位子集数据帧的最佳方法

sap*_*ico 6 mask subset masking pandas

我有一个要缩小尺寸的熊猫数据集(删除x下的所有值)。

面具是 df[my_column] > 50

我通常只使用df = df[mask],但要避免每次都进行复制,特别是因为在函数中使用它时容易出错(因为它仅在函数作用域中被更改)。

子集数据集的最佳方法是什么?

我在想一些类似的东西
df.drop(df.loc[mask].index, inplace = True)

有没有更好的方法来执行此操作,或者在任何情况下根本无法执行此操作?

Arc*_*yno 7

您缺少就地参数:

df.drop(df[df.my_column < 50].index, inplace = True)

  • 我认为你希望掩码中的 `&lt;= 50` 被删除,因为 OP 希望保留值 `&gt; 50`。 (2认同)

Elo*_*ika -1

我认为这有效。也许有更好的方法?

df = df.drop(df[df.my_column < 50].index)