Spark配置优先级

54l*_*l3d 5 hadoop-yarn apache-spark

在代码中指定spark应用程序配置之间是否存在任何差异或优先级:

SparkConf().setMaster(yarn)
Run Code Online (Sandbox Code Playgroud)

并在命令行中指定它们

spark-submit --master yarn
Run Code Online (Sandbox Code Playgroud)

Rud*_*ven 19

是的,使用set()函数给用户代码中的配置赋予最高优先级.之后,标志传递了spark-submit.

直接在SparkConf上设置的属性取最高优先级,然后将标志传递给spark-submit或spark-shell,然后选择spark-defaults.conf文件中的选项.自早期版本的Spark以来,已经重命名了一些配置键; 在这种情况下,旧的密钥名称仍然被接受,但优先级低于新密钥的任何实例.

资源


Har*_* Ck 5

有4个优先级:( 1到4,1是最高优先级):

  1. SparkConf在应用程序中设置
  2. 使用spark-submit提供的属性
  3. 属性可以在属性文件中给出.并且在提交时可以将属性文件作为参数给出
  4. 默认值