小编p7k*_*p7k的帖子

从分区文件结构创建Impala外部表

提供了如下的分区fs结构:

logs
??? log_type
    ??? 2013
        ??? 07
        ?   ??? 28
        ?   ?   ??? host1
        ?   ?   ?   ??? log_file_1.csv
        ?   ?   ??? host2
        ?   ?       ??? log_file_1.csv
        ?   ?       ??? log_file_2.csv
        ?   ??? 29
        ?       ??? host1
        ?       ?   ??? log_file_1.csv
        ?       ??? host2
        ?           ??? log_file_1.csv
        ??? 08
Run Code Online (Sandbox Code Playgroud)

我一直在尝试在Impala中创建一个外部表:

create external table log_type (
    field1    string,
    field2    string,
    ...
)
row format delimited fields terminated by '|' location '/logs/log_type/2013/08';
Run Code Online (Sandbox Code Playgroud)

我希望Impala能够进入子目录并加载所有csv文件; 但没有雪茄.不会抛出任何错误,但没有数据加载到表中.

不同的球体喜欢/logs/log_type/2013/08/*/*/logs/log_type/2013/08/*/*/*不起作用.

有没有办法做到这一点?或者我应该重组fs - …

hadoop bigdata cloudera impala

4
推荐指数
1
解决办法
6316
查看次数

标签 统计

bigdata ×1

cloudera ×1

hadoop ×1

impala ×1