在hive表中插入的值与csv文件中的字符串使用双引号

pra*_*ads 3 sql csv hadoop hive

我正在将csv文件导出到hive表中.关于csv文件:列值用双引号括起来,用逗号分隔.

来自csv的样本记录

"4","good"
"3","not bad"
"1","very worst"
Run Code Online (Sandbox Code Playgroud)

我用以下语句创建了一个hive表,

创建外部表currys(review_rating字符串,review_comment字符串)行格式字段分隔',';

表创建.

现在我使用命令load data local inpath加载数据并且它成功了.当我查询表格时,

select * from currys;
Run Code Online (Sandbox Code Playgroud)

结果是:

"4"  "good"
"3"  "not bad"
"1"   "very worst"
Run Code Online (Sandbox Code Playgroud)

代替

4  good
3  not bad
1  very worst
Run Code Online (Sandbox Code Playgroud)

记录插入双引号,不应该.

请让我知道如何摆脱这个双重报价..任何帮助或指导是高度赞赏...

先谢谢!

vis*_*akh 7

你在用serde吗?如果是这样,那么您可以regexSERDE PROPERTIES中删除引号.

或者你可以使用csv-serdefrom 在这里定义quote character.