相关疑难解决方法(0)

填写spark数据框列中缺少的日期

我有一个带有列的火花数据框 - 类型的"日期"和类型的timestamp"数量" long.对于每个日期,我都有一些数量的价值.日期按递增顺序排序.但是有一些日期缺失了.例如 - 当前df -

Date        |    Quantity
10-09-2016  |    1
11-09-2016  |    2
14-09-2016  |    0
16-09-2016  |    1
17-09-2016  |    0
20-09-2016  |    2
Run Code Online (Sandbox Code Playgroud)

正如你所看到的,df有一些缺失的日期,如12-09-2016,13-​​09-2016等.我想在数量字段中为那些缺少的日期添加0,这样得到的df应该看起来像 -

Date        |    Quantity
10-09-2016  |    1
11-09-2016  |    2
12-09-2016  |    0
13-09-2016  |    0
14-09-2016  |    0
15-09-2016  |    0
16-09-2016  |    1
17-09-2016  |    0
18-09-2016  |    0
19-09-2016  |    0
20-09-2016  |    2
Run Code Online (Sandbox Code Playgroud)

任何有关此的帮助/建议将不胜感激.提前致谢.请注意,我在scala编码.

datetime scala apache-spark apache-spark-sql

2
推荐指数
2
解决办法
3250
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

datetime ×1

scala ×1