R - 使用正则表达式从字符串中提取数字

Seb*_*ian 0 regex r stringr

如果可能的话,我想从一个带有一个表达式的字符串中提取带小数的数字.

例如,将"2,123.02"转换为"2123.02" - 我目前的解决方案是:

paste(unlist(str_extract_all("2,123.02","\\(?[0-9.]+\\)?",simplify=F)),collapse="")
Run Code Online (Sandbox Code Playgroud)

但我正在寻找的是str_extract_all中的表达式,它只是将它们自己绑定在一起作为一个向量.这是否可以用正则表达式实现?

Cat*_*ath 6

您可以尝试用空字符串替换逗号:

gsub(",", "", "2,123.02")
#[1] "2123.02"
Run Code Online (Sandbox Code Playgroud)

注意:如果您只需要在数字之间替换逗号,则可以使用外观:

gsub("(?<=[0-9]),(?=[0-9])", "", "this, this is my number 2,123.02", perl=TRUE)
#[1] "this, this is my number 2123.02"
Run Code Online (Sandbox Code Playgroud)

我编辑过,sub而不是gsub你有一个带逗号的多个数字的字符串.如果你只有一个,sub是"足够的".

NB2:您可以调用str_extrac_all结果gsub,例如:

str_extract_all(gsub("(?<=[0-9]),(?=[0-9])", "","first number: 2,123.02, second number: 3,456", perl=T), "\\d+\\.*\\d*", simplify=F)
#[[1]]
#[1] "2123.02" "3456"   
Run Code Online (Sandbox Code Playgroud)