小编a-b*_*rld的帖子

如何将托管在 HDFS 中的配置文件传递给 Spark 应用程序?

我正在使用 Spark Structured Streaming。此外,我正在与Scala. 我想将配置文件传递给我的 spark 应用程序。此配置文件托管在HDFS. 例如;

spark_job.conf (HOCON)

spark {
  appName: "",
  master: "",
  shuffle.size: 4 
  etc..
}

kafkaSource {
  servers: "",
  topic: "",
  etc..
}

redisSink {
  host: "",
  port: 999,
  timeout: 2000,
  checkpointLocation: "hdfs location",
  etc..
}
Run Code Online (Sandbox Code Playgroud)

如何将其传递给 Spark 应用程序?如何hosted HDFS在 Spark 中读取此文件()?

configuration hadoop apache-spark apache-spark-sql spark-structured-streaming

1
推荐指数
1
解决办法
1502
查看次数