我希望在我的foreach构造中生成/附加某种唯一标识符/ line_number/counter,同时遍历记录.有没有办法在不编写UDF的情况下实现这一目标?
B = foreach A生成a_unique_id,field1,...等
我如何实现'a_unique_id'?
谢谢!
主要的 Pig 发行版或 Piggybank 中没有内置的 UUID 功能。不幸的是,我认为您唯一的选择是编写 UDF。
有一种构建 UUID 的标准方法,并且您可以利用 Java 代码来构建您的 UDF。
您不想编写 UDF 是否有特殊原因?