Fuz*_*zzY 5 apache-spark
在 Spark Web UI 中,有两种 DAG 可视化,一种用于作业:
另一个用于舞台:
为解释在这里。博客文章确实解释了 Job 的 DAG 中的绿点,但是,它没有说明 Stage 的 DAG 中的那些绿色阴影框。有人可以给一个提示吗?
更新:如果这也意味着指示的代码是缓存数据的位置,我们可以做些什么来提高性能?
Ram*_*jan 6
您提供的链接中提到
其次,其中一个 RDD 在第一阶段被缓存(由绿色突出显示)
因此,绿色框表示它们正在被缓存,并且将来对这些 rdd 的引用不必从头开始生成。
归档时间:
8 年,3 月 前
查看次数:
3041 次
最近记录: