从文本文件中删除 <200b> 字符

use*_*997 19 encoding characters character-encoding

我有一个巨大的文本文件,其中包含要删除的字符串/字符 <200b>。我尝试使用 sed 但它没有用。

sed 's/<200b>//g' 文件

当我用像 gedit 这样的图形文本编辑器打开文件时,这个字符永远不会显示,我用 vim 看到它。

小智 26

<200b> 是“零宽度空间”的 Unicode。你不会发现它是一个字符串。您可以sed像这样将角色通过管道进行移除:

sed -i "s/$(echo -ne '\u200b')//g" file
Run Code Online (Sandbox Code Playgroud)

  • 欢迎使用超级用户:答案可能是正确的,但如果它包含一些关于您所做的事情、如何使用等的详细信息,对于在未来几天或几年内可能无法理解和搜索答案的人来说会更好。 (2认同)

小智 20

你也可以在 VIM 中去掉这个。

%s/\%u200b// - entire file
%s/\%u200b//g - entire file, more than one occurrence on a line
Run Code Online (Sandbox Code Playgroud)