Unicode中没有哪些字符?

Nic*_*oul 12 unicode localization character-encoding

我听说有些字符在Unicode标准中没有出现,尽管在某些地区的人们日常生活中写过.特别是我听说最近通过组装现有字符部分制作的中文名字,但我找不到任何参考.

例如,下面的字符对于5000万人来说很常见,但它不是Unicode:

在此输入图像描述

有这样的人物名单吗?(图像或网站列出图像等字符)

sle*_*ske 6

嗯,Unicode中没有大量的内容(尽管仍在添加新字符).

一些例子:

  • 由于Han Unification,Unicode对来自不同语言的几个相似字符使用一个代码点.人们不同意这些角色是否真的"相同"; 如果你认为它们应该被单独表示,那么这些单独的表示可以说是"缺失"(尽管这是一个哲学问题).
  • 类似地,许多语言(尤其是亚洲语言)有时会有一个字符/字形的多个变体."具有多个表示的一个字符"(=一个代码点)和"不同的字符"(=不同的代码点)之间的区别在某种程度上是任意的,因此存在某些人认为替代变体"缺失"的情况(例如,具有汉字字符).
  • 许多历史悠久且很少使用的角色缺失.
  • 许多旧/历史脚本不包括在内,例如Demotic.实际上,有一项计划专门用于在Unicode中包含更多脚本,脚本编码计划(SEI).

W3C还有一个关于此主题的页面,缺少字符和字形,有更多解释.

  • 我相信~260变异选择器是为了解决前两个子弹.它们的代码点是180B-180D(缩写为FVS1-3),303E(ɪᴅᴇᴏɢʀᴀᴘʜɪᴄɪᴅᴇᴏɢʀᴀᴘʜɪᴄsᴇʟᴇᴄᴛᴏʀ,IVS),FE00-FE0F(VS1-VS16)和E0100-E01EF(VS17-VS256).实际上IVS是不同的:它计为`\ p {Other_Symbol}`和`\ p {Grapheme_Base}`,而其他的是`\ p {Nonspacing_Mark}`,`\ p {Grapheme_Extend}`,`\ p {Default_Ignorable_Code_Point} `,和`\ p {Variation_Selector}`.我不知道IVS究竟是为了什么.在Scriptwise中,FVS1-3是`\ p {Mongolian},IVS是`\ p {Common}`,VS1-256是`\ p {Inherited}`.希望这可以帮助. (3认同)

jis*_*one 6

另外:这是unicode.org的不受支持的脚本列表