我想在R中使用gsub来匹配所有不是字母数字的项目

Jon*_*tes 3 regex r gsub

我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,如下所示"̆ºÌøÑ".

我想取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符使用gsub.

您可以使用gsub指定取代这些项目[abcdefghijklmnopqrstuvwxyz0123456789]

sgi*_*ibb 7

你可以简单地否定你的模式[^ ...]:

x <- "abcde🏄fgh"
gsub("[^A-Za-z0-9]", "", x)
# [1] "abcdefgh"
Run Code Online (Sandbox Code Playgroud)

请注意,该课程[:alnum:]与您给定的所有特殊字符相匹配.这就是为什么gsub("[^[:alnum:]]", "", x)不起作用.