我正在使用R搜索原始的Twitter片段,但仍然遇到有非标准字母数字字符的问题,如下所示"̆ºÌøÑ".
我想取出所有非[abcdefghijklmnopqrstuvwxyz0123456789]字符使用gsub.
您可以使用gsub指定取代这些项目不中[abcdefghijklmnopqrstuvwxyz0123456789]?
你可以简单地否定你的模式[^ ...]:
x <- "abcde🏄fgh"
gsub("[^A-Za-z0-9]", "", x)
# [1] "abcdefgh"
Run Code Online (Sandbox Code Playgroud)
请注意,该课程[:alnum:]与您给定的所有特殊字符相匹配.这就是为什么gsub("[^[:alnum:]]", "", x)不起作用.
| 归档时间: |
|
| 查看次数: |
3136 次 |
| 最近记录: |