如何查看 AWS Glue Spark UI

Ank*_*ava 6 amazon-web-services directed-acyclic-graphs pyspark aws-glue spark-ui

在我的 Glue 作业中,我启用了 Spark UI 并指定了 Spark UI 工作所需的所有必要细节(s3 相关等)。
如何查看 Glue 作业的 DAG/Spark UI?

jay*_*.cs 7

您需要设置一个可以托管历史服务器的 ec2 实例。

以下文档包含指向您可以使用的 CloudFormation 模板的链接。 https://docs.aws.amazon.com/glue/latest/dg/monitor-spark-ui-history.html

您可以通过ec2实例访问历史服务器(默认为18080)。您需要适当配置网络和端口。

编辑 - 还有一个选项可以在本地设置 SparkUI。这需要从 aws-glue-samples 存储库下载 docker 映像,并在那里设置 AWS 凭证和 s3 位置。该服务器使用粘合作业生成的文件。这些文件大约有 4MB 大。

  • 非常感谢 jay.cs 的回复。我认为如果 AWS 能够提供直接从 Glue 控制台查看 Spark UI 的功能,那将会非常有益。Glue 开发人员仅获得开发人员访问权限,并且从未被允许启动 CF 堆栈。AWS 可以在这方面做得更好。接受并结束我的问题。谢谢 (9认同)