用空值连接两列火花数据框

Pad*_*123 1 concatenation apache-spark pyspark

我的 spark 数据框中有两列

First_name  Last_name
Shiva       Kumar
Karthik     kumar
Shiva       Null
Null        Shiva
Run Code Online (Sandbox Code Playgroud)

我的要求是通过用逗号连接上述两列并处理空值来向数据帧添加一个新列。

我曾尝试使用 concat 和 coalesce,但只有当两列都可用时,我才能获得带有逗号分隔符的输出

预期输出

Full_name
Shiva,kumar
Karthik,kumar
Shiva
Shiva
Run Code Online (Sandbox Code Playgroud)

Rud*_*ven 6

concat_wsnull为您连接和处理值。

df.withColumn('Full_Name', F.concat_ws(',', F.col('First_name'), F.col('Last_name'))
Run Code Online (Sandbox Code Playgroud)