如果我有一个表有重复行的id,
我可以使用Hive和下面的查询找到它
create table dupe as select * from table1 group by id having count(*) > 1;
我们可以使用Pig执行相同的功能吗?
如果有,有人可以帮助我吗?
hadoop apache-pig
apache-pig ×1
hadoop ×1