Elv*_*ade 4 scala dataframe apache-spark apache-spark-sql
样本 :
scala> Frame.show()
|year| make|model| comment|blank|
|2012|Tesla| S| No comment| R|
|1997| Ford| E350|Go get one now th...| L|
|2015|Chevy| Volt| Try| M|
Run Code Online (Sandbox Code Playgroud)
到
<item>
<'year'>2012<'/year'>
<'make'>Tesla<'/make'>
<'model'>S<'/mode'>
</item>
Run Code Online (Sandbox Code Playgroud)
最简单的方法是使用 XML writer spark-xml:
val path: String = ???
df.write.format("com.databricks.spark.xml")
.option("rootTag", "items")
.option("rowTag", "item")
.save(path)
Run Code Online (Sandbox Code Playgroud)
如果由于某种原因它不符合您的需求,您可以单独转储记录并且saveAsTextFile:
def dumpXML(row: Row): String = ???
df.rdd.map(dumpXML).saveAsTextFile(path)
Run Code Online (Sandbox Code Playgroud)
您可以使用例如添加根元素mapPartitions。
| 归档时间: |
|
| 查看次数: |
10506 次 |
| 最近记录: |