用PigLatin将"3"转换为3

Chr*_*oph 6 csv hadoop apache-pig

我读了一个csv文件,其中包含带有这样数字的字段:"3".我可以用PigLatin将这个字段从"3"转换为3吗?我需要它来使用SUM() - 函数.

谢谢你的帮助!

Rom*_*ain 9

如何删除"带有REPLACE

例如:

data =
    LOAD 'data.txt' AS (num:CHARARRAY);

numbers =
    FOREACH data
    GENERATE
        (INT) REPLACE(num, '\\"', '');
Run Code Online (Sandbox Code Playgroud)

然后你可以GROUPSUM.

一个优点是您可以将返回的字符串直接转换为数字(无需处理行李).REGEX_EXTRACT也可以用来做同样的事情.


Jac*_*son 6

TOKENIZE函数将在被认为是单词分隔符的各种字符上拆分字符串,其中一个字符是引号.因此,如果您将"3"标记为中间项,那么它应该只有3.