Spark:如何使用标题保存数据框?

use*_*533 9 java apache-spark

dataframe.saveasTextFile,仅以分隔格式保存数据.如何在JAVA中使用标题保存数据框.

sourceRufFrame.toJavaRDD().map(new TildaDelimiter()).coalesce(1, true).saveAsTextFile(targetSrcFilePath);
Run Code Online (Sandbox Code Playgroud)

Sri*_*ini 12

如果你想保存为csv文件,我建议使用spark-csv包.您可以spark-csv使用标题简单地保存数据框.

dataFrame.write
  .format("com.databricks.spark.csv")
  .option("header", "true")
  .option("delimiter",<your delimiter>)
  .save(output)
Run Code Online (Sandbox Code Playgroud)

您可以参考以下链接,了解更多信息:https: //github.com/databricks/spark-csv

Spark-csv 有maven依赖.


Chi*_*rma 8

使用Spark 2.x,

df.write.option("header", "true").csv("path")
Run Code Online (Sandbox Code Playgroud)

干杯

  • 如果df没有记录,则不写入标题 (2认同)