小编Paw*_*mar的帖子

使用Piglatin加载文本文件时跳过标题

我有一个文本文件,它的第一行包含标题.现在我想对数据进行一些操作,但是在使用PigStorage加载文件时它也需要HEADER.我只是想跳过HEADER.是否可以(直接或通过UDF)这样做?

这是我用来加载数据的命令:

input_file = load '/home/hadoop/smdb_tracedata.csv'
USING PigStorage(',')
as (trans:chararray, carrier:chararray,aainday:chararray);
Run Code Online (Sandbox Code Playgroud)

hadoop apache-pig

15
推荐指数
4
解决办法
2万
查看次数

风暴UI值

为什么在"拓扑统计"部分下的Storm UI中,Emitted,transfer和Acked的值会有所不同以及它们是如何计算的.即使失败次数为零.

在我的案例中,发出和转移的数量相同,这是正确的,但Acked更高,失败次数为零(这是正确的).我正在使用Storm 0.9.3版本.

提前致谢.

twitter apache-storm

2
推荐指数
1
解决办法
1436
查看次数

标签 统计

apache-pig ×1

apache-storm ×1

hadoop ×1

twitter ×1