小编JTD*_*021的帖子

PySpark 数据帧何时使用 .select() 与何时使用 .withColumn()?

我是 PySpark 的新手,我发现有两种方法可以在 PySpark 中选择列,即使用“.select()”或“.withColumn()”。

据我所知,“.withColumn()”的性能较差,但除此之外,我很困惑为什么有两种方法可以做同样的事情。

那么我什么时候应该使用“.select()”而不是“.withColumn()”?

我用谷歌搜索过这个问题,但没有找到明确的解释。

python pyspark

3
推荐指数
1
解决办法
2430
查看次数

标签 统计

pyspark ×1

python ×1