小编use*_*819的帖子

如何在spark中使用Regexp_replace

我非常新的火花,并希望在数据帧的列执行操作,以替换所有,与列.

假设有一个数据帧x和列x4

x4
1,3435
1,6566
-0,34435
Run Code Online (Sandbox Code Playgroud)

我希望输出为

x4
1.3435
1.6566
-0.34435
Run Code Online (Sandbox Code Playgroud)

我正在使用的代码是

import org.apache.spark.sql.Column
def replace = regexp_replace((x.x4,1,6566:String,1.6566:String)x.x4)
Run Code Online (Sandbox Code Playgroud)

但是我收到以下错误

import org.apache.spark.sql.Column
<console>:1: error: ')' expected but '.' found.
       def replace = regexp_replace((train_df.x37,0,160430299:String,0.160430299:String)train_df.x37)
Run Code Online (Sandbox Code Playgroud)

任何有关语法,逻辑或任何其他合适方式的帮助都将非常感激

scala apache-spark apache-spark-sql regexp-replace

9
推荐指数
1
解决办法
4万
查看次数