Databricks Python 与 Scala

XTe*_*Tec 2 spark-streaming databricks

我在 databricks 中有一个集群。在导入数据之前,我想在 python 和 scala 之间进行选择,在从源读取/写入大数据方面,哪一个更好?

Joe*_*den 5

对于dataframe api,应该是相同的性能。对于 rdd api,scala 会更快。