可能在Unicode中组合字符序列

and*_*rew 2 unicode

有些字符不包含在Unicode中(即带有重音的西里尔字母),但可以使用组合序列创建.据我所知,可能的组合字符序列是在布局引擎和/或使用的字体中定义的.我对吗?那么,如何获得所有可能的组合序列?

McD*_*ell 5

你是正确的,因为尝试创建任意组合序列可能会因布局引擎和字体的组合而失败.这个问题的解决方案超出了Unicode标准的范围.

Unicode 6.2开始,第2章:

所有组合字符都可以应用于任何基本字符,原则上可以与任何脚本一起使用.与其他字符一样,将组合字符分配给一个块或另一个块仅标识其主要用法; 它无意定义或限制可应用的字符范围.在Unicode标准中,允许所有字符代码序列.

这并不会对实现产生同等支持所有可能组合的义务.因此,虽然允许将阿拉伯语注释标记应用于汉字或梵文辅音,但在渲染或理解上不太可能得到很好的支持.