相关疑难解决方法(0)

将数据从.txt文件加载到表中存储为Hive中的ORC

我有一个.txt格式的数据文件.我正在使用该文件将数据加载到Hive表中.当我在一个表中加载文件时

CREATE TABLE test_details_txt(
visit_id INT,
store_id SMALLINT) STORED AS TEXTFILE;
Run Code Online (Sandbox Code Playgroud)

使用正确加载数据

LOAD DATA LOCAL INPATH '/home/user/test_details.txt' INTO TABLE test_details_txt;
Run Code Online (Sandbox Code Playgroud)

我可以SELECT * FROM test_details_txt;在Hive的桌子上跑一个.

但是,如果我尝试在表中加载数据

CREATE TABLE test_details_txt(
visit_id INT,
store_id SMALLINT) STORED AS ORC; 
Run Code Online (Sandbox Code Playgroud)

尝试运行SELECT时收到以下错误:

Failed with exception java.io.IOException:java.io.IOException: Malformed ORC file hdfs://master:6000/user/hive/warehouse/test.db/transaction_details/test_details.txt. Invalid postscript.

使用上面的LOAD语句加载数据时,我没有收到任何错误或异常.

使用命令将数据存储到ORC表时还有什么需要完成的LOAD DATA IN PATH..吗?

hadoop hive

35
推荐指数
2
解决办法
7万
查看次数

标签 统计

hadoop ×1

hive ×1