我有一个字母,其中包含字母数字字符,特殊字符和非UTF-8字符.我想删除特殊和非utf-8字符.
这是我尝试过的:
gsub('[^0-9a-z\\s]','',"�+ Sample string here =�{�>E�BH�P<]�{�>")
Run Code Online (Sandbox Code Playgroud)
但是,这会删除特殊字符(标点符号+非utf8),但输出没有空格.
gsub('/[^0-9a-z\\s]/i','',"�+ Sample string here =�{�>E�BH�P<]�{�>")
Run Code Online (Sandbox Code Playgroud)
结果有空格但仍然存在非utf8字符.
有什么工作吗?
对于上面的示例字符串,输出应为:此处的示例字符串