在sql中,我们可以为ex.做"选择*从表格中col1不在('A','B');"
我想知道是否有相当的pyspark.我能够找到sql的"isin"函数,如'IN'子句,但没有找到'NOT IN'.
非常感谢任何帮助.
我刚遇到同样的问题并找到了解决方案.如果你想否定任何条件(在pySpark中表示为Column类),则有否定运算符~,例如:
df.where(~df.flag.isin(1, 2, 3)) # records with flag NOT IN (1, 2, 3)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4967 次 |
| 最近记录: |