我有一个 PySpark UDF,它接受一个数组并返回其后缀:
func.udf( lambda ng: ng[1:], ArrayType(IntegerType()) )
有没有可能把它变成一个标量pandas_udf?Pandas 是否提供必要的矢量化操作?
谢谢
pandas apache-spark-sql pyspark
apache-spark-sql ×1
pandas ×1
pyspark ×1