相关疑难解决方法(0)

将 PySpark 数组列乘以标量

我正在尝试将数组类型的列乘以标量。这个标量也是来自同一个 PySpark 数据帧的值。

例如,我有这个数据框:

df = sc.parallelize([([1, 2],3)]).toDF(["l","factor"])
+------+------+
|     l|factor|
+------+------+
|[1, 2]|     3|
+------+------+
Run Code Online (Sandbox Code Playgroud)

我想要实现的是:

+------+------+
|     l|factor|
+------+------+
|[3, 6]|     3|
+------+------+
Run Code Online (Sandbox Code Playgroud)

这是我尝试过的:

df.withColumn("l", lit("factor") * df.l)
Run Code Online (Sandbox Code Playgroud)

它返回一个类型不匹配错误。如何将数组类型的列乘以一个数字?

multiplication apache-spark apache-spark-sql pyspark

2
推荐指数
1
解决办法
630
查看次数