字符串映射转换配置单元

jig*_*hah 0 hadoop hive map

我有一个有四列的表.

C1    C2    C3    C4
--------------------
x1    y1    z1    d1
x2    y2    z2    d2
Run Code Online (Sandbox Code Playgroud)

现在我想将它转换为具有键和值对的地图数据类型并加载到单独的表中.

create table test
(
   level map<string,string>
)
row format delimited
COLLECTION ITEMS TERMINATED BY '&'
map keys terminated by '=';
Run Code Online (Sandbox Code Playgroud)

现在我在sql下面使用加载数据.

insert overwrite table test
select str_to_map(concat('level1=',c1,'&','level2=',c2,'&','level3=',c3,'&','level4=',c4) from input;
Run Code Online (Sandbox Code Playgroud)

在表格上选择查询.

select * from test;
{"level1":"x1","level2":"y1","level3":"z1","level4":"d1=\\"}
{"level1":"x2","level2":"y2","level3":"z2","level4":"d2=\\"}
Run Code Online (Sandbox Code Playgroud)

我没理解为什么我在最后一个值中得到额外的"=\\".

我仔细检查数据,但问题仍然存在.

你能帮忙吗?

Muk*_*h S 6

str_to_map(text, delimiter1, delimiter2) - 通过使用两个分隔符解析文本将文本拆分为键值对来创建映射.第一个分隔符分隔对,第二个分隔符分配键和值.如果只给出一个参数,则使用默认分隔符:','as delimiter1'='as delimiter2.

您可以通过运行以下命令获取此信息:

describe function extended str_to_map
Run Code Online (Sandbox Code Playgroud)

在您的语法中有两个错误:

insert overwrite table test
select str_to_map(concat('level1=',c1,'&','level2=',c2,'&','level3=',c3,'&','level4=',c4) from input;
Run Code Online (Sandbox Code Playgroud)

首先是,缺少一个括号).

第二,它基本上不是一个错误,你没有给定分隔符所以函数采用分隔符的默认值,这就是你的结果中得到','的原因.

要以当前格式获取输出,您应该尝试以下查询:

insert overwrite table test
select str_to_map(concat('level1=',c1,'&','level2=',c2,'&','level3=',c3,'&','level4=',c4),'&','=') from input;
Run Code Online (Sandbox Code Playgroud)