将常量值列添加到spark数据帧

Gau*_*sal 6 apache-spark pyspark databricks

我在Databricks中使用Spark 2.1版.我有一个数据框wamp,我想要添加一个名为的列region,该列应该采用常量值NE.但是,NameError: name 'lit' is not defined当我运行以下命令时出现错误:

wamp = wamp.withColumn('region', lit('NE'))
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?

muo*_*uon 14

你需要导入 lit

from pyspark.sql.functions import *
Run Code Online (Sandbox Code Playgroud)

lit提供

或类似的东西

import pyspark.sql.functions as sf
wamp = wamp.withColumn('region', sf.lit('NE'))
Run Code Online (Sandbox Code Playgroud)