Nam*_*lah 2 unicode localization ucs2 utf-8 utf-16
我正在开发一个程序,它给出正确的文本格式,例如,如果我写\xd8\xb3\xd9\x84\xd8\xa7\xd9\x85,那么它给出的FEB3, FEE0, FE8E and FEE2是\xd8\xb3\xd9\x80 的 Unicode,\ xd9\x80\xd9\x84\xd9\x80,\xef\xba\x8e,\xd9\x80\xd9\x85,那么如果我写\xd9\xbc\xd9\x88\xd9\x84则字符\的 Unicode xd9\xbc是,但字符\xd9\xbc\xd9\x80067C没有 Unicode,它是初始上下文形式。
所以我找到了\xd9\xbc,\xda\xab,\xda\x81,\xda\x85,\xda\xbc,\xda\x9a,\xda\x89,\xdb\x8d,\xda\ 的Unicode隔离 x93,\xdb\x90在维基百科中,但我找不到上下文形式的Unicode 。
\n\n例如\xd9\xbc\xd9\x80 、\xd9\x80\xd9\xbc\xd9\x80、\xd9\x80\xd9\xbc的Unicode。
\n\n如果有人知道这个问题的解决方案,我正在等待回复。\n谢谢...
\nUnicode 字符是抽象的,因为它没有特定的表示形式。显示阿拉伯语等草书文字的首选方法是存储标准的、非上下文形式,并在显示时将它们转换为草书形式 - 也就是说,作为操作系统中文本显示系统的最后阶段之一或文字处理器。
草书形式通常作为字体中的字形提供,并使用体现上下文规则的字体文件中的表格中的信息来选择。
Unicode 存储了大量的阿拉伯语上下文形式,但只是为了与旧编码和传统金属类型兼容,而传统金属类型只能提供有限数量的物理字形。不幸的是,对于您的目的而言,这些上下文形式并未涵盖阿拉伯语以外的语言中使用的所有扩展字符,例如您给出的示例,即普什图语中使用的 U+067C ARABIC LETTER TEH WITH RING。
在我看来,不太可能添加更多的上下文阿拉伯语形式。因此,您提出的程序无法运行,至少根据其当前的设计是这样。