相关疑难解决方法(0)

Pyspark:在UDF中传递多个列

我正在编写一个用户定义的函数,它将获取除数据帧中第一个之外的所有列并进行求和(或任何其他操作).现在数据框有时可以有3列或4列或更多列.它会有所不同.

我知道我可以硬编码4个列名作为UDF传递,但在这种情况下它会有所不同所以我想知道如何完成它?

以下是第一个示例中的两个示例,我们有两列要添加,第二个示例中我们有三列要添加.

在此输入图像描述

apache-spark pyspark spark-dataframe

30
推荐指数
4
解决办法
3万
查看次数

标签 统计

apache-spark ×1

pyspark ×1

spark-dataframe ×1