小编Mar*_*ink的帖子

Hive在引用字段中使用逗号加载CSV

我正在尝试将CS​​V文件加载到Hive表中,如下所示:

CREATE TABLE mytable
(
num1 INT,
text1 STRING,
num2 INT,
text2 STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ",";

LOAD DATA LOCAL INPATH '/data.csv'
OVERWRITE INTO TABLE mytable;    
Run Code Online (Sandbox Code Playgroud)


csv由逗号(,)分隔,如下所示:

1, "some text, with comma in it", 123, "more text"
Run Code Online (Sandbox Code Playgroud)

这将返回损坏的数据,因为第一个字符串中有一个','.
有没有办法设置文本分隔符或让Hive忽略字符串中的','?

我无法更改csv的分隔符,因为它是从外部源中提取的.

hadoop hbase hive delimiter hdfs

46
推荐指数
3
解决办法
10万
查看次数

标签 统计

delimiter ×1

hadoop ×1

hbase ×1

hdfs ×1

hive ×1