小编Pir*_*ack的帖子

如何使用Java中的spark在Dataframe中使用特定值替换空值?

我正在尝试提高使用Java在Spark中实现的Logistic回归算法的准确性.为此,我试图用该列的最频繁值替换列中存在的Null或无效值.例如:-

Name|Place
a   |a1
a   |a2
a   |a2
    |d1
b   |a2
c   |a2
c   |
    |
d   |c1
Run Code Online (Sandbox Code Playgroud)

在这种情况下,我将"Name"列中的所有NULL值替换为"a",将"Place"替换为"a2"列.到目前为止,我只能提取特定列中最常见的列.关于如何用该列的最常用值替换空值或无效值,能否帮助我完成第二步.

java apache-spark

20
推荐指数
3
解决办法
4万
查看次数

标签 统计

apache-spark ×1

java ×1