spark中的转换和rdd函数有什么区别?

j p*_*mar 4 scala apache-spark rdd

我正在阅读 spark 教科书,我看到了转换和动作,我再次阅读了 rdd 函数,所以我很困惑,谁能解释一下转换和 spark rdd 函数之间的基本区别。

两者都用于更改 rdd 数据内容并返回一个新的 rdd 但我想知道确切的解释。

Ram*_*jan 6

Sparkrdd函数是transformationsactions两者。Transformation是改变rdd数据Action的函数,是一个不改变数据但给出输出的函数。
例如:
mapfilterunion等都是transformation因为他们在改变现有数据有所帮助。 reduce, collect,count都是action因为它们给出输出而不是改变数据。欲了解更多信息,请访问SparkJacek