小编And*_*ani的帖子

Spark Dataframe 与 pandas-on Spark Dataframe

我对 pySpark 很陌生,但我对 Spark Dataframe (例如从 RDD 创建)和 pandas-on-spark Dataframe 之间的区别感到困惑。

  • 这些是同一个对象吗?从类型上看,它们似乎是不同的类别。
  • 如果有的话,核心区别是什么?(我知道使用 pandas-on-spark Dataframe 可以在分布式 Dataframe 上使用与 Pandas 几乎相同的语法,但我想知道是否只有这一点不同)

谢谢

apache-spark-sql pyspark

9
推荐指数
1
解决办法
6930
查看次数

标签 统计

apache-spark-sql ×1

pyspark ×1