hab*_*ats 7 hadoop-yarn apache-spark google-cloud-dataproc
通过添加以下内容,我可以很好地连接到驱动程序:
spark.driver.extraJavaOptions=-Dcom.sun.management.jmxremote \
-Dcom.sun.management.jmxremote.port=9178 \
-Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.ssl=false
Run Code Online (Sandbox Code Playgroud)
但是做...
spark.executor.extraJavaOptions=-Dcom.sun.management.jmxremote \
-Dcom.sun.management.jmxremote.port=9178 \
-Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.ssl=false
Run Code Online (Sandbox Code Playgroud)
...只会在驱动程序上产生一堆错误......
Container id: container_1501548048292_0024_01_000003
Exit code: 1
Stack trace: ExitCodeException exitCode=1:
at org.apache.hadoop.util.Shell.runCommand(Shell.java:972)
at org.apache.hadoop.util.Shell.run(Shell.java:869)
at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:1170)
at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:236)
at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:305)
at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:84)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:748)
Container exited with a non-zero exit code 1
Run Code Online (Sandbox Code Playgroud)
...最终使工作崩溃。
工人没有错误,它只是退出:
[org.apache.spark.util.ShutdownHookManager] - Shutdown hook called
Run Code Online (Sandbox Code Playgroud)
Spark v2.2.0,集群是一个简单的 1m-2w 配置,我的作业在没有执行程序参数的情况下运行没有问题。
正如Rick Mortiz指出的那样,问题是执行器 jmx 的端口冲突。
环境:
-Dcom.sun.management.jmxremote.port=0
Run Code Online (Sandbox Code Playgroud)
产生一个随机端口,并消除 Spark 中的错误。要确定它最终使用哪个端口,请执行以下操作:
netstat -alp | grep LISTEN.*<executor-pid>/java
Run Code Online (Sandbox Code Playgroud)
其中列出了该进程当前打开的端口。
| 归档时间: |
|
| 查看次数: |
2970 次 |
| 最近记录: |