火花串中的缓存是否会提高性能

ben*_*man 5 apache-spark spark-streaming

所以我正在kafka流中的同一个rdd上执行多个操作.是否缓存RDD会提高性能?

ban*_*ara 1

\n

Spark 还支持将数据集拉入集群范围的内存缓存中。当重复访问数据时,例如查询小型 \xe2\x80\x9chot\xe2\x80\x9d 数据集或运行迭代算法(如 PageRank)时,这非常有用。

\n
\n\n

https://spark.apache.org/docs/latest/quick-start.html#caching

\n