大多数编程语言都对Unicode 有一些支持,但是所有编程语言都有一些或多或少的记录的极端情况,其中的东西将无法正常工作.
例子
Java: StringBuilder/StringBuffer中的reverse()正常工作.但是如果一个字符需要超过16位进行编码,那么String中的length(),charAt()等就不会出现.
C#: 没有找到正确的反向方法,长度和索引访问返回错误的结果.
Perl:同样的问题.
PHP: 根本没有Unicode的想法,mbstring有一些更好的工作替代品.
我想知道是否有一种编程语言,它具有完整和正确的Unicode支持?那里必须做出什么妥协才能实现这样的目标?
它是如何在内部实施的?
我看到Python 3在这方面有一些很大的变化.Python 3现在与正确的实现有多接近?
language-agnostic string unicode encoding programming-languages