特定
test<-"Low-Decarie, Etienne"
Run Code Online (Sandbox Code Playgroud)
我希望用空格替换所有标点符号
gsub(pattern="[:punct:]", x=test, replacement=" ")
Run Code Online (Sandbox Code Playgroud)
但这会产生
"Low-De arie, E ie e"
Run Code Online (Sandbox Code Playgroud)
没有替换标点符号并删除明显随机的字母(尽管它们可能与标点符号相关联,标签为t,下一行为n).
Pie*_*nte 21
同意MontReal用户.
几个选项,结果相同.
在R Base中,只需加倍括号
gsub(pattern="[[:punct:]]", test, replacement=" ")
[1] "Low Decarie Etienne"
Run Code Online (Sandbox Code Playgroud)
包stringr具有str_replace_all这样做的功能.
library(stringr)
str_replace_all(test, "[[:punct:]]", " ")
Run Code Online (Sandbox Code Playgroud)
或者只保留字母
str_replace_all(test, "[^[:alnum:]]", " ")
Run Code Online (Sandbox Code Playgroud)