Hos*_*ork 8 unicode utf-8 case-insensitive
显然拉丁字母表确实如此.但我在概念意义上,跨语言和Unicode规范问这个问题.
实际上,这是为了比较两个字符串.如果您已经知道它们在所有语言中的字节数不同 - 您是否可以认为这足以保证它们不是同一字符串的不同"套管"版本?
没有.
考虑U + 0069"i",它具有69UTF-8 的八位字节值.在大写形式U + 0130"İ"中,此代码点形成UTF-8序列C4 B0.
强制性说明:案例是区域敏感的.
| 归档时间: |
|
| 查看次数: |
997 次 |
| 最近记录: |