bho*_*ass 5 swap caching apache-spark
当我显式调用rdd.cache时,我可以从spark控制台存储选项卡中看到,实际上只缓存了一小部分rdd.我的问题是剩下的部分在哪里?Spark如何决定在缓存中留下哪个部分?
同样的问题适用于sc.textFile()读入的初始原始数据.我知道这些rdd会自动缓存,即使spark控制台存储表没有显示有关其缓存状态的任何信息.我们知道有多少是缓存与丢失的?
| 归档时间: |
|
| 查看次数: |
3507 次 |
| 最近记录: |