Mar*_*kus 11 python apache-spark apache-spark-sql pyspark
如何在PySpark中创建一个新列并使用今天的日期填充此列?
这是我试过的:
import datetime
now = datetime.datetime.now()
df = df.withColumn("date", str(now)[:10])
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
AssertionError:col应该是Column
hi-*_*zir 20
如何在PySpark中创建一个新列并使用今天的日期填充此列?
已有功能:
from pyspark.sql.functions import current_date
df.withColumn("date", current_date().cast("string"))
Run Code Online (Sandbox Code Playgroud)
AssertionError:col应该是Column
使用文字
from pyspark.sql.functions import lit
df.withColumn("date", lit(str(now)[:10]))
Run Code Online (Sandbox Code Playgroud)