SQL就像Pyspark数据帧的NOT IN子句

sh1*_*291 3 pyspark

在sql中,我们可以为ex.做"选择*从表格中col1不在('A','B');"

我想知道是否有相当的pyspark.我能够找到sql的"isin"函数,如'IN'子句,但没有找到'NOT IN'.

非常感谢任何帮助.

Mar*_*usz 9

我刚遇到同样的问题并找到了解决方案.如果你想否定任何条件(在pySpark中表示为Column类),则有否定运算符~,例如:

df.where(~df.flag.isin(1, 2, 3)) # records with flag NOT IN (1, 2, 3)
Run Code Online (Sandbox Code Playgroud)