我想创建一个Hive表,其中输入文本文件遍历到hdfs中的多个子目录.所以我在hdfs中有这样的例子:
/testdata/user/Jan/part-0001
/testdata/user/Feb/part-0001
/testdata/user/Mar/part-0001
and so on...
Run Code Online (Sandbox Code Playgroud)
如果我想在hive中创建一个表用户,但是能够遍历用户的子目录,可以这样做吗?我试过这样的事,但是没有用;
CREATE EXTERNAL TABLE users (id int, name string)
STORED AS TEXTFILE LOCATION '/testdata/user/*'
Run Code Online (Sandbox Code Playgroud)
我认为添加通配符会起作用但不会.当我尝试不使用通配符仍然无法正常工作.但是,如果我将文件复制到用户的根目录,那么它的工作原理.Hive没有办法遍历子目录,并抓住这些文件?