Unicode中的国家(非阿拉伯语)数字?

Pet*_*etr 7 unicode

我知道unicode包含来自大多数世界aphabets的所有字符..但是数字呢?它们是否是unicode的一部分?我无法找到直接答案.谢谢

Ama*_*osh 10

如前所述,印度 - 阿拉伯数字(0,1,..,9)包含在Unicode中,继承自ASCII.如果你在谈论用其他语言表示数字,答案仍然是肯定的,它们也是Unicode的一部分.

//numbers (0-9) in Malayalam (language spoken in Kerala, India)
? ? ? ? ? ? ? ? ? ?  
//numbers (0-9) in Hindi (India's national language)
? ? ? ? ? ? ? ? ? ? 
Run Code Online (Sandbox Code Playgroud)

您可以使用\p{N}\p{Number}在正则表达式中匹配任何脚本中的任何类型的数字字符.

文档(第3页)描述了马拉雅拉姆语数字的Unicode代码点.

  • 尽管 `\p{N}` 或 `\p{Number}` 似乎适用于许多语言环境(马拉雅拉姆语、印地语、阿拉伯语),但它在某些类型上确实失败了。例如,[Japanese](http://en.wikipedia.org/wiki/Japanese_numerals)、[Hebrew](http://en.wikipedia.org/wiki/Hebrew_numerals)、中文和其他一些失败。 (2认同)

Bol*_*olo 5

简而言之:是的,当然。在 UNICODE 中有三类包含数字和数字的各种表示:

  • 数字、十进制数字字符)——例如阿拉伯语、泰语、梵文数字;
  • 数字、字母字符)——例如罗马数字;
  • 数字、其他字符)——例如分数。