在RDD持久性方面,spark cache()和persist()spark 之间有什么区别?
RDD
cache()
persist()
distributed-computing apache-spark rdd
在 Apache Spark 中,这些 API 之间有什么区别?为什么以及何时我们应该选择其中之一而不是其他?
java jvm scala hdfs apache-spark
apache-spark ×2
distributed-computing ×1
hdfs ×1
java ×1
jvm ×1
rdd ×1
scala ×1