我有一个场景,数据框列中有 XML 数据。
| 性别 | 更新时间 | 访客 |
|---|---|---|
| F | 1574264158 | <?xml版本=“1.0”编码=“utf-8” |
我想使用 UDF 解析 - 访客列 - 将嵌套的 XML 字段解析到 Dataframe 中的列中
XML 格式
<?xml version="1.0" encoding="utf-8"?> <visitors> <visitor id="9615" age="68" sex="F" /> <visitor id="1882" age="34" sex="M" /> <visitor id="5987" age="23" sex="M" /> </visitors>
Run Code Online (Sandbox Code Playgroud) xml user-defined-functions apache-spark apache-spark-sql pyspark