小编acc*_*rma的帖子

将列的元素除以按另一列的元素分组的元素(同一列)的总和

我一直在研究aSspark应用程序并尝试转换数据帧,如表1所示.我想将列(_2)的每个元素除以另一列(_1)的元素组成的元素之和(_2) ).表2是预期结果.

表格1

+---+---+
| _1| _2|
+---+---+
|  0| 13|
|  0|  7|
|  0|  3|
|  0|  1|
|  0|  1|
|  1|  4|
|  1|  8|
|  1| 18|
|  1|  4|
+---+---+
Run Code Online (Sandbox Code Playgroud)

表2

+---+----+
| _1| _2 |
+---+----+
|  0|13/x|
|  0| 7/x|
|  0| 3/x|
|  0| 1/x|
|  0| 1/x|
|  1| 4/y|
|  1| 8/y|
|  1|18/y|
|  1| 4/y|
+---+----+
Run Code Online (Sandbox Code Playgroud)

其中,x =(13 + 7 + 3 + 1 + 1)和y =(4 …

scala apache-spark apache-spark-sql

7
推荐指数
1
解决办法
3501
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

scala ×1