您可以使用\\p{M}Unicode 类别将变音符号与类似 Perl 的正则表达式进行匹配,并且gsub将所有这些一次性地进行匹配,如下所示:
sample1 <- "\xd7\x94\xd6\xbb\xd7\xa1\xd6\xb0\xd7\x9e\xd6\xb7\xd7\xa7"\ngsub("\\\\p{M}", "", sample1, perl=T)\nRun Code Online (Sandbox Code Playgroud)\n\n结果:[1] "\xd7\x94\xd7\xa1\xd7\x9e\xd7\xa7"
查看演示
\n\n\n\n\n\n
\\p{M}或\\p{Mark}:要与另一个字符组合的字符(例如重音符号、变音符号、封闭框等)。
有关更多信息,请访问Regular-Expressions.info,“Unicode 类别”。
\n| 归档时间: |
|
| 查看次数: |
589 次 |
| 最近记录: |