我打算规范化为C格式,然后划分为“显示单位”,基本上是一个字形以及所有以下组合字符。现在,我只是想处理基于拉丁语的脚本。
要确定代码点是否为组合字符,是否足以检查它是否在这些范围内?
阿拉伯文,希伯来文和各种印度文字待定...
unicode
unicode ×1