是否存在可以用 UTF-16 编码但不能用 UTF-8 编码的字符?

Pau*_*lor 2 utf-8 utf-16

是否存在可以用 UTF-16 编码但不能用 UTF-8 编码的字符

SLa*_*aks 5

不。

UTF-* 是可以对全范围 Unicode 字符进行编码的编码。
编码之间的差异在于每个字符使用多少字节。

  • 事实上,UTF-8 可以物理编码的代码点 (U+0000 - U+7FFFFFFF) 比 UTF-16 可以物理编码的代码点 (U+0000 - U+10FFFF) 更多。UTF-8 最初为如此高的代码点定义了 5 字节和 6 字节格式,但后来被限制为仅编码 UTF-16 可以编码的相同代码点以实现兼容性,因此将其限制为最大 4 字节,更高的代码点是非法的。 (3认同)