我是hadoop蜂巢的新手.我们正在使用开源hadoop蜂巢.它安装在ubuntu单节点集群上.我在csv文件中有100万行数据,我把它从windows移到linux.使用foolwing命令将数据上传到配置单元时,空值将上传到表中.
LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv'
OVERWRITE INTO TABLE rejstats;
Run Code Online (Sandbox Code Playgroud)
我甚至尝试通过替换文件hdfs来上传值,但同样的问题仍然存在.
我的表结构如下:
CREATE TABLE rejstats( amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;
Run Code Online (Sandbox Code Playgroud)
我附加了返回的空值的屏幕截图.
请有人帮我解决这个问题.谢谢.
此致,Divya.
我想您正在尝试在使用FIELDS TERMINATED BY '\t'ie tab 的表中输入逗号分隔文件.请尝试以下方法:
CREATE TABLE rejstats (amount_requested INT , appdate TIMESTAMP ,
loan_title STRING , dbt_income_ratio FLOAT , city STRING ,
state STRING , employment_lenght STRING) ROW FORMAT DELIMITED FIELDS
TERMINATED BY ',' STORED AS TEXTFILE;
LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv'
OVERWRITE INTO TABLE rejstats;
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
10111 次 |
| 最近记录: |