我是 PySpark 的新手,我发现有两种方法可以在 PySpark 中选择列,即使用“.select()”或“.withColumn()”。
据我所知,“.withColumn()”的性能较差,但除此之外,我很困惑为什么有两种方法可以做同样的事情。
那么我什么时候应该使用“.select()”而不是“.withColumn()”?
我用谷歌搜索过这个问题,但没有找到明确的解释。
python pyspark
pyspark ×1
python ×1