标签: hive

使用 hiveql 的累积和

我在 Hive 中有一张表,如下所示:

col1       col2
b           1
b           2
a           3
b           2
c           4
c           5
Run Code Online (Sandbox Code Playgroud)

我如何使用 hiveql 将col1元素组合在一起,将它们相加,按总和排序,以及基于总和创建累积总和 (csum)?

id       sum_all     csum
a         3           3
b         5           8
c         9           17
Run Code Online (Sandbox Code Playgroud)

我只设法提出了分组和总和,但我对累积总和没有想法。Hive 不支持相关子查询

select col1 as id
      sum(col2) as sum_all
from t
group by col1
order by sum_all
Run Code Online (Sandbox Code Playgroud)

结果如下:

id       sum_all
a         3
b         5
c         9
Run Code Online (Sandbox Code Playgroud)

hive

5
推荐指数
1
解决办法
9001
查看次数

标签 统计

hive ×1