提供了如下的分区fs结构:
logs
??? log_type
??? 2013
??? 07
? ??? 28
? ? ??? host1
? ? ? ??? log_file_1.csv
? ? ??? host2
? ? ??? log_file_1.csv
? ? ??? log_file_2.csv
? ??? 29
? ??? host1
? ? ??? log_file_1.csv
? ??? host2
? ??? log_file_1.csv
??? 08
Run Code Online (Sandbox Code Playgroud)
我一直在尝试在Impala中创建一个外部表:
create external table log_type (
field1 string,
field2 string,
...
)
row format delimited fields terminated by '|' location '/logs/log_type/2013/08';
Run Code Online (Sandbox Code Playgroud)
我希望Impala能够进入子目录并加载所有csv文件; 但没有雪茄.不会抛出任何错误,但没有数据加载到表中.
不同的球体喜欢/logs/log_type/2013/08/*/* 或/logs/log_type/2013/08/*/*/*不起作用.
有没有办法做到这一点?或者我应该重组fs - …