小编Go *_*gen的帖子

对数组进行操作的 Pandas UDF

我有一个 PySpark UDF,它接受一个数组并返回其后缀:

func.udf( lambda ng: ng[1:], ArrayType(IntegerType()) )
Run Code Online (Sandbox Code Playgroud)

有没有可能把它变成一个标量pandas_udf?Pandas 是否提供必要的矢量化操作?

谢谢

pandas apache-spark-sql pyspark

3
推荐指数
1
解决办法
3279
查看次数

标签 统计

apache-spark-sql ×1

pandas ×1

pyspark ×1