小编Pav*_*ani的帖子

Spark中的Xml处理

场景:我的输入将是多个小型XML,并且我们希望将这些XML作为RDD读取.与另一个数据集执行连接并形成RDD并将输出作为XML发送.

是否可以使用spark读取XML,将数据加载为RDD?如果可能,将如何读取XML.

示例XML:

<root>
    <users>
        <user>
              <account>1234<\account>
              <name>name_1<\name>
              <number>34233<\number>
         <\user>
         <user>
              <account>58789<\account>
              <name>name_2<\name>
              <number>54697<\number>
         <\user>    
    <\users>
<\root>
Run Code Online (Sandbox Code Playgroud)

如何将其加载到RDD中?

apache-spark

18
推荐指数
3
解决办法
4万
查看次数

标签 统计

apache-spark ×1