您可以将[^[:ascii:]]结构与类似Perl的正则表达式一起使用,以从输入中删除非ASCII代码,还可以添加替代方法[][]以匹配方括号:
text <- "[Peanut M&M\u0092s]"
replaced <- gsub("[][]|[^[:ascii:]]", "", text, perl=T)
replaced
## => [1] "Peanut M&Ms"
Run Code Online (Sandbox Code Playgroud)
如果仅计划删除\0092符号,则不需要像regex这样的Perl:
replaced <- gsub("[][\u0092]", "", text)
Run Code Online (Sandbox Code Playgroud)
观看另一个演示
请注意,这[...]是一个与1个符号匹配的字符类,此处为]或[或\u0092。如果放在]字符类的开头,则不需要转义。[不需要在字符类内部进行转义(在R regex和其他一些样式中也是如此)。
| 归档时间: |
|
| 查看次数: |
1672 次 |
| 最近记录: |