小编aal*_*sum的帖子

使用PigLatin删除重复项

我正在使用PigLatin过滤一些记录.

User1  8 NYC 
User1  9 NYC 
User1  7 LA 
User2  4 NYC
User2  3 DC 
Run Code Online (Sandbox Code Playgroud)

该脚本应删除用户的副本,并保留其中一个记录.像linux中的唯一命令.

输出应该是:

User1 8 NYC 
User2 4 NYC
Run Code Online (Sandbox Code Playgroud)

有什么建议?

apache-pig

9
推荐指数
1
解决办法
2万
查看次数

标签 统计

apache-pig ×1