Ari*_*ali 12 hadoop apache-pig
它看起来像一个愚蠢的问题,但我找不到从我的行中过滤空值的方法.这是我转储对象geoinfo时的结果:
DUMP地理信息;
([经度#70.95853,纬度#30.9773])
([经度#9.37944507,纬度#38.91780853])
(null)
(null)
(null)
([经度#-92.64416,纬度#16.73326])
(null)
(null)
([经度#-9.15199849,纬度#38.71179122])
([经度#9.15210796,纬度#38.71195131])
这是描述
DESCRIBE geoinfo;
geoinfo:{geoLocation:bytearray}
我想要做的是过滤这样的空值:
geoinfo_no_nulls = FILTER geoinfo BY geoLocation不为null;
但结果仍然相同.没有过滤.
我也试过这样的事
geoinfo_no_nulls = FILTER geoinfo BY geoLocation!='null';
我收到了一个错误
org.apache.pig.backend.executionengine.ExecException:错误1071:无法将地图转换为字符串
我究竟做错了什么?
细节,在ubuntu上运行,hadoop-1.0.3与pig 0.9.3
pig -version Apache Pig版本0.9.3-SNAPSHOT(rexported)编译于2012年10月24日,19:04:03
java版"1.6.0_24"OpenJDK运行时环境(IcedTea6 1.11.4)(6b24-1.11.4-1ubuntu0.12.04.1)OpenJDK 64位服务器VM(内置20.0-b12,混合模式)
我遇到了类似的问题,类似的事情对我有用:
geoinfo_no_nulls = FILTER geoinfo BY geoLocation != '';
Run Code Online (Sandbox Code Playgroud)