使用 pyspark 创建年份列

Die*_*dez 1 python apache-spark apache-spark-sql pyspark

我有一个时间戳列,我想从此列创建一个年份列。我知道如何显示它,但我无法在我的数据集上创建一列。到目前为止,我已经尝试过这个:

data = data.withColumn('Year', data.select(year(('Date')))
Run Code Online (Sandbox Code Playgroud)

但它抛出一个错误说:

断言错误:col 应该是 Column

我能够显示年份这样做:

data.select(year('Date').alias('Year')).show()
Run Code Online (Sandbox Code Playgroud)

Sai*_*r S 5

您需要为 year 函数提供一列。以下将起作用:

data = data.withColumn('Year', year(col('Date')))