相关疑难解决方法(0)

在Hive中收集COLLECT_SET(),保留重复项?

有没有办法将重复项保存在Hive中的收集集中,或者模拟Hive使用其他方法提供的聚合集合的类型?我想将列中具有相同键的所有项聚合到一个数组中,并重复.

IE:

hash_id | num_of_cats
=====================
ad3jkfk            4
ad3jkfk            4
ad3jkfk            2
fkjh43f            1
fkjh43f            8
fkjh43f            8
rjkhd93            7
rjkhd93            4
rjkhd93            7
Run Code Online (Sandbox Code Playgroud)

应该返回:

hash_agg | cats_aggregate
===========================
ad3jkfk   Array<int>(4,4,2)
fkjh43f   Array<int>(1,8,8)
rjkhd93   Array<int>(7,4,7)
Run Code Online (Sandbox Code Playgroud)

java hadoop hive user-defined-functions

37
推荐指数
4
解决办法
5万
查看次数

标签 统计

hadoop ×1

hive ×1

java ×1

user-defined-functions ×1