我正在阅读 spark 教科书,我看到了转换和动作,我再次阅读了 rdd 函数,所以我很困惑,谁能解释一下转换和 spark rdd 函数之间的基本区别。
两者都用于更改 rdd 数据内容并返回一个新的 rdd 但我想知道确切的解释。
scala apache-spark rdd
我可以DataFrame从不同的SparkSessions访问a吗?
DataFrame
SparkSession
dataframe apache-spark apache-spark-sql
apache-spark ×2
apache-spark-sql ×1
dataframe ×1
rdd ×1
scala ×1