小编hdy*_*hdy的帖子

pyspark sql数据框仅保留null

我有一个 sql 数据框df,并且有一列user_id,如何过滤数据框并仅保留user_id实际上为空以进行进一步分析?从这里的pyspark 模块页面,人们可以轻松地删除 na 行,但没有说明如何执行相反的操作。

尝试过df.filter(df.user_id == 'null'),但结果是 0 列。也许它正在寻找字符串“null”。也df.filter(df.user_id == null)不起作用,因为它正在寻找名为“null”的变量

sql null dataframe apache-spark pyspark

3
推荐指数
1
解决办法
1747
查看次数

标签 统计

apache-spark ×1

dataframe ×1

null ×1

pyspark ×1

sql ×1