我正在使用PigLatin过滤一些记录.
User1 8 NYC
User1 9 NYC
User1 7 LA
User2 4 NYC
User2 3 DC
Run Code Online (Sandbox Code Playgroud)
该脚本应删除用户的副本,并保留其中一个记录.像linux中的唯一命令.
输出应该是:
User1 8 NYC
User2 4 NYC
Run Code Online (Sandbox Code Playgroud)
有什么建议?
apache-pig ×1