为什么unicode Superscripts和Subscripts块不包含所有字母的简单序列?

lef*_*out 6 unicode

可以用作超/下标字母的字符排列似乎完全混乱.其中大多数显然打算用作sup/subscr.信件,但即使是那些没有提示非常合理的订单.在Unicode 6.0中,现在终于在U + 2095到U + 209C中有下划线字母ht的按字母排序的子集,但这明显相当于块中的剩余空间并且包含不到所有字母的1/3 .

为什么联盟不仅仅为小写字母分配至少一个sup和一个下标字母表的足够空间?

Gar*_*ees 6

这些字符排列的混乱是因为它们是零碎编码的,因为使用它们的脚本被编码,并且添加了与其他字符集的往返兼容性.Unicode标准的第15章对它们的起源进行了一些讨论:例如,上标数字1到3在ISO Latin-1中,而其他数字被编码为支持MARC-8书目字符集(参见此处的表格); 和U + 2071 SUPERSCRIPT LATIN小写字母I和U + 207F SUPERSCRIPT LATIN小写字母 N编码为支持Uralic Phonetic Alphabet.

Unicode联盟有一个不编码字符的一般策略,除非有一些证据表明人们正在使用这些字符来进行需要编码的语义区别.因此,字符不会被编码只是为了完成集合,或者使事物看起来整洁.

  • 因此,他们添加了一个雪☃雪人和一个没有雪的雪人so,这样这个世界的天气预报员可以避免沉闷的雪花❄,但我们永远不会得到我们丢失的上标q‽‽ (5认同)
  • 我很好奇这种对不存在的语义的追逐最终会在什么时候结束。我不明白我怎么可能在下标中使用一些字母但不是全部?谁决定我实际上不需要至少 25 个字符?他们是否考虑了所有赞成和反对的论点?我很好奇专业类别中有什么?“嘿,没有方程式,这很好,因为无论如何人们都讨厌数学!” (4认同)
  • 当然,加雷斯·里斯的观点非常明确。我的评论只是一个笑话(也是我使用 unicode 雪人的唯一机会)。虽然我在用 unicode 编码的纯文本电子邮件中编写数学时_确实_错过了“q”指数...... (2认同)