Pad*_*123 1 concatenation apache-spark pyspark
我的 spark 数据框中有两列
First_name  Last_name
Shiva       Kumar
Karthik     kumar
Shiva       Null
Null        Shiva
我的要求是通过用逗号连接上述两列并处理空值来向数据帧添加一个新列。
我曾尝试使用 concat 和 coalesce,但只有当两列都可用时,我才能获得带有逗号分隔符的输出
预期输出
Full_name
Shiva,kumar
Karthik,kumar
Shiva
Shiva
concat_wsnull为您连接和处理值。
df.withColumn('Full_Name', F.concat_ws(',', F.col('First_name'), F.col('Last_name'))