在PySparkShell 应用程序 UI ([server]:8088) 的“存储”选项卡上,我可以看到有关我正在使用的 RDD 的信息。其中一列是Fraction Cached。
我如何以编程方式检索该百分比?
我可以用来getStorageLevel()获取一些有关 RDD 缓存的信息,但不能获取Fraction Cached 的信息。
getStorageLevel()
需要我自己计算吗?
python apache-spark rdd pyspark
apache-spark ×1
pyspark ×1
python ×1
rdd ×1