想象一下,我有以下表格可供我使用:
A: { x: int, y: int, z: int, ...99 other columns... }
我现在想要对此进行转换,将z其设置为NULLwhere x > y,将结果数据集存储为B.
z
NULL
x > y
B
我想这样做而不必明确提及所有其他列,因为这成为维护的噩梦.
有简单的解决方案吗?
hadoop apache-pig
apache-pig ×1
hadoop ×1