小编Abh*_*Ray的帖子

根据列的数据类型在pyspark数据框中填充空值

假设我有一个示例数据框,如下所示:

+-----+----+----+
| col1|col2|col3|
+-----+----+----+
|  cat|  10| 1.5|
|  dog|  20| 9.0|
| null|  30|null|
|mouse|null|15.3|
+-----+----+----+
Run Code Online (Sandbox Code Playgroud)

我想根据数据类型填充空值。例如,对于字符串类型,我想填充“N/A”,对于整数类型,我想添加 0。同样,对于浮点数,我想添加 0.0。

我尝试使用 df.fillna() 但后来我意识到可能有“N”列,所以我想要一个动态解决方案。

apache-spark-sql pyspark

1
推荐指数
1
解决办法
2212
查看次数

标签 统计

apache-spark-sql ×1

pyspark ×1