相关疑难解决方法(0)

文件中的奇怪字符

我有一个 UTF-8 文件,其中包含一个奇怪的字符——对我来说就像

<96>
Run Code Online (Sandbox Code Playgroud)

这是它的显示方式 vi

vi 截图

以及它如何出现 gedit

gedit 截图

以及它在 LibreOffice 下的显示方式

LibreOffice 屏幕截图

这使得一系列基本的 Unix 工具行为不端,包括:

  1. cat file使角色消失,more以及
  2. 我无法在 vi/vim 中复制和粘贴——它甚至找不到自己
  3. grep 也无法显示任何内容,就好像该字符不存在一样。

该程序file运行良好并识别出一个 UTF-8 文件。我也知道,由于文件的性质,它很可能来自网络上的复制和粘贴,并且该字符最初代表 EMDASH。

我的基本问题是:

  1. 这个文件有什么问题吗?
  2. 如何在同一个文件中搜索它的其他出现?
  3. 如何 grep 其他可能包含相同问题/字符的文件?

该文件可以在这里找到:file.txt

character-encoding unicode

6
推荐指数
1
解决办法
7401
查看次数

标签 统计

character-encoding ×1

unicode ×1