相关疑难解决方法(0)

C:确定UTF-8字符串中UTF-16字符串需要多少字节的最有效方法

我已经看到一些非常聪明的代码用于在Unicode代码点和UTF-8之间进行转换,所以我想知道是否有人(或者会喜欢设计)这个.

  • 给定UTF-8字符串,相同字符串的UTF-16编码需要多少字节.
  • 假设UTF-8字符串已经过验证.它没有BOM,没有超长序列,没有无效序列,是空终止的.它不是CESU-8.
  • 必须支持带代理的完整UTF-16.

具体来说,我想知道是否有快捷方式可以在不完全将UTF-8序列转换为代码点的情况下知道何时需要代理对.

我见过的最好的UTF-8代码点代码使用了矢量化技术,所以我想知道这是否也可以.

c algorithm utf-8 utf-16 unicode-string

6
推荐指数
1
解决办法
772
查看次数

标签 统计

algorithm ×1

c ×1

unicode-string ×1

utf-16 ×1

utf-8 ×1