如何使用 regex_replace 替换 pyspark 数据框中列中的特殊字符

Cha*_*rty 3 regex dataframe apache-spark pyspark

数据框中有一个列批次。它具有诸如'9%'、'$5'等值。

我需要regex_replace以一种从上面的示例中删除特殊字符并仅保留数字部分的方式使用。

例如,在同一列中,9 和 5 分别替换 9% 和 $5。

und*_*ble 7

df.withColumn("batch",regexp_replace(col("batch"), "/[^0-9]+/", ""))
Run Code Online (Sandbox Code Playgroud)