我在 Hive 中有一张表,如下所示:
col1 col2
b 1
b 2
a 3
b 2
c 4
c 5
Run Code Online (Sandbox Code Playgroud)
我如何使用 hiveql 将col1元素组合在一起,将它们相加,按总和排序,以及基于总和创建累积总和 (csum)?
id sum_all csum
a 3 3
b 5 8
c 9 17
Run Code Online (Sandbox Code Playgroud)
我只设法提出了分组和总和,但我对累积总和没有想法。Hive 不支持相关子查询
select col1 as id
sum(col2) as sum_all
from t
group by col1
order by sum_all
Run Code Online (Sandbox Code Playgroud)
结果如下:
id sum_all
a 3
b 5
c 9
Run Code Online (Sandbox Code Playgroud) hive ×1