mpi*_*eki 5 css user-interface localhost apache-spark google-cloud-dataproc
我是第一次使用 Apache Spark。我运行我的应用程序,当我访问时,localhost:4040我得到了图片中显示的内容。我发现也许设置
spark.ui.enabled true
Run Code Online (Sandbox Code Playgroud)
可以提供帮助,但我不知道该怎么做。
提前致谢。
我在 Google Cloud Dataproc 上使用 Spark 时遇到了同样的问题。
如果您不是直接通过端口访问 Spark Job UI 4040,而是通过 YARN Web UI(8088端口)访问 Spark Job UI,您将看到正确呈现的网页。
要在直接通过端口访问 Spark UI 时解决此问题,4040您需要重置spark.ui.proxyBaseSpark 作业内的属性(而不是在 CLI/作业提交命令中),因为它会被 Spark UI 代理覆盖:
sys.props.update("spark.ui.proxyBase", "")
Run Code Online (Sandbox Code Playgroud)
下面是这个问题的详细描述。
我有同样的问题。此外,对http://localhost:4040/api/v1/applications 的调用未能返回,没有响应。
这是由于我的类路径中两个版本的 Jersey 之间发生冲突而发生的。主要是1.x和2.x之间的冲突。对我有用的是在我的 Maven 构建中排除来自非 Spark 的其他依赖项的 Jersey 库。
例如:
<dependency>
<groupId>org.apache.parquet</groupId>
<artifactId>parquet-avro</artifactId>
<version>1.9.0</version>
<exclusions>
<exclusion>
<groupId>com.sun.jersey</groupId>
<artifactId>*</artifactId>
</exclusion>
</exclusions>
</dependency>
Run Code Online (Sandbox Code Playgroud)
排除 Jersey 1.x 版本(My Spark 发行版使用 2.x)解决了该问题。
编辑:
另外 -> 当 servlet api 2.5 JAR 位于类路径中或与 3.x 一起时发生