小编Jas*_*onA的帖子

存储输出到单个CSV?

目前,当我存储到HDFS时,它会创建许多部分文件.

有没有办法存储到单个CSV文件?

apache-pig

14
推荐指数
2
解决办法
1万
查看次数

无法推断COUNT函数

我正在尝试编写一个pig latin脚本来提取我已经过滤的数据集的计数.

到目前为止这是脚本:

/* scans by title */

scans           = LOAD '/hive/scans/*' USING PigStorage(',') AS (thetime:long,product_id:long,lat:double,lon:double,user:chararray,category:chararray,title:chararray);
productscans    = FILTER scans BY (title MATCHES 'proactiv');
scancount       = FOREACH productscans GENERATE COUNT($0);
DUMP scancount;
Run Code Online (Sandbox Code Playgroud)

出于某种原因,我收到错误:

无法将org.apache.pig.builtin.COUNT的匹配函数推断为多个或不适合.请使用明确的演员.

我在这做错了什么?我假设它与我传入的字段类型有关,但我似乎无法解决这个问题.

TIA,Jason

apache-pig

9
推荐指数
2
解决办法
1万
查看次数

标签 统计

apache-pig ×2