Cha*_*rty 3 regex dataframe apache-spark pyspark
数据框中有一个列批次。它具有诸如'9%'、'$5'等值。
我需要regex_replace
以一种从上面的示例中删除特殊字符并仅保留数字部分的方式使用。
例如,在同一列中,9 和 5 分别替换 9% 和 $5。
df.withColumn("batch",regexp_replace(col("batch"), "/[^0-9]+/", ""))
Run Code Online (Sandbox Code Playgroud)