可以用作超/下标字母的字符排列似乎完全混乱.其中大多数显然不打算用作sup/subscr.信件,但即使是那些没有提示非常合理的订单.在Unicode 6.0中,现在终于在U + 2095到U + 209C中有下划线字母ht的按字母排序的子集,但这明显相当于块中的剩余空间并且包含不到所有字母的1/3 .
为什么联盟不仅仅为小写字母分配至少一个sup和一个下标字母表的足够空间?
这些字符排列的混乱是因为它们是零碎编码的,因为使用它们的脚本被编码,并且添加了与其他字符集的往返兼容性.Unicode标准的第15章对它们的起源进行了一些讨论:例如,上标数字1到3在ISO Latin-1中,而其他数字被编码为支持MARC-8书目字符集(参见此处的表格); 和U + 2071 SUPERSCRIPT LATIN小写字母I和U + 207F SUPERSCRIPT LATIN小写字母 N编码为支持Uralic Phonetic Alphabet.
Unicode联盟有一个不编码字符的一般策略,除非有一些证据表明人们正在使用这些字符来进行需要编码的语义区别.因此,字符不会被编码只是为了完成集合,或者使事物看起来整洁.
| 归档时间: |
|
| 查看次数: |
1402 次 |
| 最近记录: |