小编Sar*_*a S的帖子

我有多个匹配的正则表达式提取问题

我试图从字符串 "60 ML of paracetomol and 0.5 ML of XYZ" 中提取 60 ML 和 0.5 ML。该字符串是 spark 数据帧中 X 列的一部分。虽然我能够测试我的正则表达式代码以在正则表达式验证器中提取 60 ML 和 0.5 ML,但我无法使用 regexp_extract 提取它,因为它仅针对第一个匹配项。因此我只得到 60 ML。

你能建议我使用 UDF 的最佳方法吗?

pyspark

3
推荐指数
1
解决办法
3731
查看次数

标签 统计

pyspark ×1