Apache Flink - 在作业中无法识别自定义Java选项

Omr*_*nor 8 java apache-flink flink-streaming

我已将以下行添加到flink-conf.yaml:

env.java.opts:" - Ddy.props.path =/PATH/TO/PROPS/FILE"

当启动jobmanager(jobmanager.sh启动集群)时,我在日志中看到jvm选项确实被识别

2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -  JVM Options:
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -Xms256m
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -Xmx256m
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -XX:MaxPermSize=256m
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -Ddy.props.path=/srv/dy/stream-aggregators/aggregators.conf
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -Dlog.file=/srv/flink-1.2.0/log/flink-flink-jobmanager-0-flinkvm-master.log
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -Dlog4j.configuration=file:/srv/flink-1.2.0/conf/log4j.properties
2017-02-20 12:19:23,536 INFO  org.apache.flink.runtime.jobmanager.JobManager                -     -Dlogback.configurationFile=file:/srv/flink-1.2.0/conf/logback.xml
Run Code Online (Sandbox Code Playgroud)

但是当我运行flink作业(flink run -d PROG.JAR)时,System.getProperty("dy.props.path")返回null(当打印系统属性时,我发现它确实不存在.)

问题是 - 如何设置flink-job代码中可用的系统属性?

Daw*_*icz 2

这个问题与 Flink [1]的运行时架构密切相关。

我了解您正在独立集群中运行您的作业。请记住,JobManagerTaskManagers 在单独的 jvm 实例中运行。您必须考虑每个代码块将在哪里执行。

例如,像mapor这样的转换中的代码filter是在TaskManager. main入口类方法中的代码是在命令行工具中执行的flink,当然它没有设置系统属性,因为它会生成一个临时(-d)jvm,仅用于作业提交。

如果您通过在您的方法上执行的WebUI代码提交作业,那么该属性将被设置。mainJobManager

一般来说,我宁愿不鼓励通过系统属性传递程序参数,因为这是一种不好的做法。


下面有一个简单的例子:

我已开始:

  • JobManagerenv.java.opts:"-Ddy.props.path=jobmanager"
  • TaskManagerenv.java.opts:"-Ddy.props.path=taskmanager"

我的工作代码如下:

object Main {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    val stream = env.fromCollection(1 to 4)

    val prop = System.getProperty("dy.props.path")
    stream.map(_ => System.getProperty("dy.props.path") + "  mainArg: " + prop).print()

    env.execute("stream")
  }
}
Run Code Online (Sandbox Code Playgroud)

当我通过工具提交代码时,flink输​​出如下:

taskmanager  mainArg: null
taskmanager  mainArg: null
taskmanager  mainArg: null
taskmanager  mainArg: null
Run Code Online (Sandbox Code Playgroud)

当它通过提交时WebUI我得到:

taskmanager  mainArg: jobmanager
taskmanager  mainArg: jobmanager
taskmanager  mainArg: jobmanager
taskmanager  mainArg: jobmanager
Run Code Online (Sandbox Code Playgroud)