小编MrG*_*MrG的帖子

使用Scala从Spark中列的一系列值汇总到一个新列

我有一个如下的数据框

articles
10
99
101
101
10005
1000001
1000001
Run Code Online (Sandbox Code Playgroud)

我想要输出数据帧如下

range              sum
1-100              109
101-10000          202
10001-1000000      10005
1000001-100000000  2000002
...                ...
Run Code Online (Sandbox Code Playgroud)

如何实现这一目标.我是新来的火花和斯卡拉.

scala apache-spark apache-spark-sql

2
推荐指数
3
解决办法
1543
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

scala ×1