我有一个文本文件,它的第一行包含标题.现在我想对数据进行一些操作,但是在使用PigStorage加载文件时它也需要HEADER.我只是想跳过HEADER.是否可以(直接或通过UDF)这样做?
这是我用来加载数据的命令:
input_file = load '/home/hadoop/smdb_tracedata.csv'
USING PigStorage(',')
as (trans:chararray, carrier:chararray,aainday:chararray);
Run Code Online (Sandbox Code Playgroud) 为什么在"拓扑统计"部分下的Storm UI中,Emitted,transfer和Acked的值会有所不同以及它们是如何计算的.即使失败次数为零.
在我的案例中,发出和转移的数量相同,这是正确的,但Acked更高,失败次数为零(这是正确的).我正在使用Storm 0.9.3版本.
提前致谢.