小编Die*_*dez的帖子

使用 pyspark 创建年份列

我有一个时间戳列,我想从此列创建一个年份列。我知道如何显示它,但我无法在我的数据集上创建一列。到目前为止,我已经尝试过这个:

data = data.withColumn('Year', data.select(year(('Date')))
Run Code Online (Sandbox Code Playgroud)

但它抛出一个错误说:

断言错误:col 应该是 Column

我能够显示年份这样做:

data.select(year('Date').alias('Year')).show()
Run Code Online (Sandbox Code Playgroud)

python apache-spark apache-spark-sql pyspark

1
推荐指数
1
解决办法
4159
查看次数

按对列出的列表

我有两个列表,我想创建一个列表列表但要维护订单,所以如果我有:

l1 = [1,2,3,2]
l2 = [2,3,4,1]
Run Code Online (Sandbox Code Playgroud)

我想拥有:

ans = [[1,2],[2,3],[3,4],[2,1]]
Run Code Online (Sandbox Code Playgroud)

它维护索引的顺序

谢谢!

python list python-3.x

0
推荐指数
1
解决办法
1025
查看次数