网站中的外国字符

Bil*_*ill 0 html character-encoding

我找到了一个包含字符串"don't"的网站.明显的意图是"不要"这个词.我看着源代码希望看到一些字符引用,但没有(它只是显示文字字符串"不要".谷歌搜索没有产生任何东西(期望很多其他网站有同样的问题!).有谁解释这里发生了什么?

编辑:这是使用的元标记:

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
Run Code Online (Sandbox Code Playgroud)

这会不会导致页面在HTTP标头中作为Latin-1提供?

dka*_*arp 5

在浏览器中,将页面编码切换为"UTF-8".你会看到一个正确的单引号字符,它由0xE2 0x80 0x99UTF-8中的八位字节编码.在你的charset,windows-1252中,这3个八位字节呈现为"â€".该页面应该在HTTP标头或HTML <meta>标签中明确指定UTF-8作为其字符集,但它可能不是.