根据文档,可以告诉 Spark 跟踪“超出范围”的检查点——那些不再需要的检查点——并从磁盘中清除它们。
SparkSession.builder
...
.config("spark.cleaner.referenceTracking.cleanCheckpoints", "true")
.getOrCreate()
Run Code Online (Sandbox Code Playgroud)
显然它这样做了,但问题是,最后一个检查点的 rdd 永远不会被删除。
0c514fb8-498c-4455-b147-aff242bd7381从SparkContext相同的方式获取applicationId