Joh*_*ohn 1 character-encoding
有人给我发了一个文本文件。虽然我可以阅读大部分文档,但有时会出现异常字符。当我在 VIM 中打开它时,我看到 <92> 在它的位置。当我使用 gedit 时,我看到一个字符看起来像一个正方形,正方形中有两个零和 9 和 4。
有没有办法将这些有趣的字符解码回人类可读的等价物?
我还在shell中运行了以下内容:
johncomputer> file --mime-encoding file.txt
johncomputer> file.txt: : utf-8
Run Code Online (Sandbox Code Playgroud)
所以我认为它是 utf8 编码的。
哦,还有,这是一个文本文档,其中大多数字符都是可读的。只是一些(不是全部)重音字符出现了奇怪的现象。
很可能您看到的 <92> 和 <94> 是windows-1252编码的“智能”(卷曲)撇号和“智能”右双引号。当然,它们几乎可以是任何东西,但在 UTF-8 中,这样的字节不能作为“独立”出现,只能作为字符的多字节表示的第二个或后面的字节,
归档时间: |
|
查看次数: |
8568 次 |
最近记录: |