小编Mr.*_*sou的帖子

使用 UDF 解析 PySpark Dataframe 中的嵌套 XML 字段

我有一个场景,数据框列中有 XML 数据。

性别 更新时间 访客
F 1574264158 <?xml版本=“1.0”编码=“utf-8”

我想使用 UDF 解析 - 访客列 - 将嵌套的 XML 字段解析到 Dataframe 中的列中

XML 格式

<?xml version="1.0" encoding="utf-8"?> <visitors> <visitor id="9615" age="68" sex="F" /> <visitor id="1882" age="34" sex="M" /> <visitor id="5987" age="23" sex="M" /> </visitors>
Run Code Online (Sandbox Code Playgroud)

xml user-defined-functions apache-spark apache-spark-sql pyspark

3
推荐指数
1
解决办法
6155
查看次数