这是什么性格?â\u0080\u0099

Bil*_*unn 4 ruby character-encoding

这个字符是什么: â\u0080\u0099 ?

这应该是撇号或单引号。

如何将它(使用 Ruby)转换为简单的单引号 ' 或在网页中正确显示为单引号?

谢谢

Juk*_*ela 6

这是一个排版正确的撇号,更准确地说是 RIGHT SINGLE QUOTATION MARK' (U+2019) ('),经过一些不正确的字符代码转换或解释。它似乎是该字符的 UTF-8 编码形式(三个字节,0xE2 0x80 0x99)被错误地解释为 ISO-8859-1 编码数据。

  • 顺便说一句,我使用命令 `iconv -f utf8 -t iso-8859-1 < input` 修复了一个充满垃圾的文件,这导致了实际上有效的 UTF-8 文本(我基本上执行了初始错误 munge 的逆操作) )。以防万一其他人看到此内容并尝试修复一些文本。 (2认同)