如何向 apache Pig 中已有的表添加列

sam*_*kgp 5 hadoop apache-pig

我已经有一个使用 Pig 创建的表。现在我想在每一行(记录)中添加一个随机数,以便为我提供一个包含此添加列的新表。

这可能吗?如何实现?

Lor*_*dig 2

您可以使用RANDOM UDF 来实现此目的。
例如:

A = ...
B = foreach A generate (int)(RANDOM()*100.0) as rnd, [other fields...]
Run Code Online (Sandbox Code Playgroud)