相关疑难解决方法(0)

如何从文本文件中删除非UTF-8字符

我有一堆阿拉伯语,英语,俄语文件,用utf-8编码.尝试使用Perl脚本处理这些文件,我收到此错误:

Malformed UTF-8 character (fatal)
Run Code Online (Sandbox Code Playgroud)

手动检查这些文件的内容,我发现其中有一些奇怪的字符.现在我正在寻找一种从文件中自动删除这些字符的方法.

无论如何要做到这一点?

linux bash text utf-8 character-encoding

76
推荐指数
2
解决办法
9万
查看次数

标签 统计

bash ×1

character-encoding ×1

linux ×1

text ×1

utf-8 ×1