Dar*_*der 1 localization utf-8 internationalization
在什么情况下你会推荐使用UTF-8?是否有替代方案可以达到相同的目的?
i18n 使用 UTF-8?
由于您用网页设计标记了这一点,我假设您需要优化代码大小以尽可能小以快速传输文件。
UTF-8 的替代方案是其他 Unicode 编码,因为除了使用 Unicode 之外别无选择(至少对于常规计算机系统而言)。
如果您查看 UTF-8 的指定方式,您会发现 U+007F 之前的所有代码点都需要 1 个八位字节,U+07FF 之前的代码点需要 2 个八位字节,U+FFFF 之前的 3 个和 4 个八位字节代码点最大为 U+10FFFF 的八位位组。对于 UTF-16,您将需要两个最大 U+FFFF(大部分)的八位字节,以及四个最大 U+10FFFF 的八位字节。对于 UTF-32,所有 unicode 点都需要四个八位字节。
换句话说,与 UTF-16 相比,U+07FF 以下的脚本将因使用 UTF-8 而获得一些大小优势,而高于 U+07FF 的脚本将有一些大小损失。然而,由于该领域是网页设计,因此可能值得注意的是,所有控制字符都位于 UTF-8 的一个八位字节范围内,这对于具有大量 HTML 标记和 Javascript 的文本来说不太正确。实际“文本”的数量。
U+07FF 下的文字包括拉丁语(除了一些扩展,例如声调标记)、希腊语、西里尔语、希伯来语以及可能更多。维基百科对 Unicode 问题有很好的报道,您可以在Unicode Consortium上获得更多详细信息。