相关疑难解决方法(0)

如何使用pyspark从列表中获取最后一项?

为什么列1st_from_end包含null:

from pyspark.sql.functions import split
df = sqlContext.createDataFrame([('a b c d',)], ['s',])
df.select(   split(df.s, ' ')[0].alias('0th'),
             split(df.s, ' ')[3].alias('3rd'),
             split(df.s, ' ')[-1].alias('1st_from_end')
         ).show()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述
我认为使用[-1]是一种pythonic方式来获取列表中的最后一项.怎么会在pyspark不起作用?

apache-spark apache-spark-sql pyspark

6
推荐指数
2
解决办法
5604
查看次数

标签 统计

apache-spark ×1

apache-spark-sql ×1

pyspark ×1