Cha*_*rty 3 regex dataframe apache-spark pyspark
数据框中有一个列批次。它具有诸如'9%'、'$5'等值。
我需要regex_replace以一种从上面的示例中删除特殊字符并仅保留数字部分的方式使用。
例如,在同一列中,9 和 5 分别替换 9% 和 $5。
df.withColumn("batch",regexp_replace(col("batch"), "/[^0-9]+/", ""))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
36942 次 |
| 最近记录: |