如何使用 regex_replace 替换 pyspark 数据框中列中的特殊字符

Cha*_*rty 3 regex dataframe apache-spark pyspark

数据框中有一个列批次。它具有诸如'9%'、'$5'等值。

我需要regex_replace以一种从上面的示例中删除特殊字符并仅保留数字部分的方式使用。

例如，在同一列中，9 和 5 分别替换 9% 和 $5。

df.withColumn("batch",regexp_replace(col("batch"), "/[^0-9]+/", ""))

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，2 月前
查看次数：	36942 次
最近记录：	8 年，2 月前

在正则表达式范围内转义点 68

在Pandas DataFrame中选择多个列范围 26

检查按下的空格,然后使用多语言的jquery添加diez标签 20

Pandas,DataFrame:将一列拆分成多列 12

Apache .htaccess <此处不允许使用目录 8

R:data.frame的聚合列 7

PHOENIX SPARK - 将表加载为DataFrame 5

如何将整个pyspark数据帧的大小写更改为较低或较高 3

如何使用 terraform 部署 EMR Terraform，这是一个简单的开箱即用的工作示例 3

Python Pandas Dataframe 条件 If、Elif、Else 2

"INNER JOIN"和"OUTER JOIN"有什么区别？ 4506

循环内的JavaScript闭包 - 简单实用的例子 2689

如何使用Git将标签推送到远程存储库？ 2091

JavaScript等效于printf/String.Format 1874

接口和抽象类之间有什么区别？ 1705

家谱软件中的循环 1594

如何在Ruby on Rails迁移中重命名数据库列？ 1419

接口与抽象类(通用OO) 1372

如何在Linux shell脚本中提示是/否/取消输入？ 1352

Android Studio中的Gradle是什么？ 1257