将HTML编码从UTF-8切换到UTF-16会出现什么问题?

New*_*bie 5 html encoding utf-8 utf-16

对于HTML编码,从UTF-8到UTF-16的更改有何影响?我想知道你对这个问题的看法.在做出这样的改变之前,我还需要考虑一些事情吗?

注意:由于我需要处理大量的日文和中文文本而感兴趣.

Pow*_*ord 8

我可以想到一些会出错的事情:

  1. 您必须在HTTP标头中指定它是UTF-16.与UTF-8不同,UTF-16 兼容ASCII,这意味着一切都需要从一开始就是UTF-16.
  2. 较旧的客户不支持UTF-16.例如,Windows 9x上的任何内容.也可能是Mac OS9.
  3. 哦,等等,我差点忘了:默认情况下,北美和欧洲的Windows XP副本没有安装亚洲字体.

  • 问题3:该问题与字符是以UTF-8还是UTF-16编码无关. (6认同)
  • 当然,其中一些在 2017 年与我最初在 2009 年写这篇文章时相比不太相关。 (2认同)

Jon*_*eet 7

  • 假设您的大部分HTML都是ASCII,那么您的带宽消耗可能几乎翻倍
  • 错误地假设UTF-8(或ASCII)的客户端将会混淆

为什么更改为UTF-16?

  • OP 提到了大量的中文和日文文本,但关于标记的观点很好。 (2认同)