在R中,如何在gsub中使用正则表达式[:punct:]?

Eti*_*rie 12 regex r

特定

test<-"Low-Decarie, Etienne"
Run Code Online (Sandbox Code Playgroud)

我希望用空格替换所有标点符号

gsub(pattern="[:punct:]", x=test, replacement=" ")
Run Code Online (Sandbox Code Playgroud)

但这会产生

"Low-De arie, E ie  e"
Run Code Online (Sandbox Code Playgroud)

没有替换标点符号并删除明显随机的字母(尽管它们可能与标点符号相关联,标签为t,下一行为n).

Pie*_*nte 21

同意MontReal用户.

几个选项,结果相同.

在R Base中,只需加倍括号

gsub(pattern="[[:punct:]]", test, replacement=" ")

[1] "Low Decarie  Etienne"
Run Code Online (Sandbox Code Playgroud)

stringr具有str_replace_all这样做的功能.

library(stringr)
str_replace_all(test, "[[:punct:]]", " ")
Run Code Online (Sandbox Code Playgroud)

或者只保留字母

str_replace_all(test, "[^[:alnum:]]", " ")
Run Code Online (Sandbox Code Playgroud)