Han*_*nes 100 java unicode number-systems apache-commons-lang3
根据文档,字符串'123'是数字.
由于我认为这可能是文档中的错误,我运行测试来验证该语句.我发现根据Apache Commons,它是数字的.
为什么这个字符串数字?这些人物代表什么?
And*_*ner 197
因为"CharSequence仅包含Unicode数字"(引用您的链接文档).
所有字符都返回true Character.isDigit:
一些包含数字的Unicode字符范围:
- '\ u0030'到'\ u0039',ISO-LATIN-1位数('0'到'9')
- '\ u0660'到'\ u0669',阿拉伯语 - 印度数字
- '\ u06F0'到'\ u06F9',扩展阿拉伯语 - 印度数字
- '\ u0966'通过'\ u096F',梵文数字
- '\ uFF10'到'\ uFF19',全宽数字
许多其他字符范围也包含数字.
??? 是梵文数字:
Mar*_*oun 26
您可以Character#getType用来检查角色的常规类别:
System.out.println(Character.DECIMAL_DIGIT_NUMBER == Character.getType('?'));
Run Code Online (Sandbox Code Playgroud)
这将打印true,这是"1"是数字编号的"证据" .
现在让我们检查'1'字符的unicode值:
System.out.println(Integer.toHexString('?'));
// 967
Run Code Online (Sandbox Code Playgroud)
这个数字在梵文数字的范围内- 这是:\u0966通过\u096F.
还试试:
Character.UnicodeBlock block = Character.UnicodeBlock.of('?');
System.out.println(block.toString());
// DEVANAGARI
Run Code Online (Sandbox Code Playgroud)
梵文是:
是印度和尼泊尔的abugida(alphasyllabary)字母表
"123"是"123"(基本拉丁语unicode).
读:
Sol*_*zky 23
如果您想知道特定"角色"具有哪些属性(并且有相当多的属性),请直接转到源:Unicode.org.他们拥有研究工具,可以向您展示您最想知道的任何事情.
如果要查看特定字符的所有属性,请尝试以下操作:
http://unicode.org/cldr/utility/character.jsp?a=1
要么:
如果要查看所有分类为"十进制数字"的字符(即数字值为0到9),请尝试以下操作:
http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Numeric_Type=Decimal:](550个
代码点 - 当前/从Unicode 9.0开始)
如果要查看所有分类为"非十进制数字"的字符(即分数,带圆圈等),请尝试以下操作:
http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Numeric_Type=Numeric:](836个
代码点 - 当前/从Unicode 9.0开始)
如果要查看所有分类为"十进制数字"的字符(即数字值为0到9),但只能通过Unicode 6.0(.NET使用),请尝试以下操作:
http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Numeric_Type=Decimal:]%26[:Age=6.0:](420个
代码点 - 不应该更改)
如果要查看所有分类为"十进制数字"的字符(即数字值为0到9),但只能通过Unicode 6.0(.NET使用),并且只能在Base-Multilingual Plane/no Supplementary Characters中查看(即没有代码点65535/U + 0xFFFF以上,请尝试以下方法:
http://unicode.org/cldr/utility/list-unicodeset.jsp?a=[:Numeric_Type=Decimal:]%26[:Age=6.0:]%26[:bmp=Yes:](350
个代码点 - - 而且不应该改变)
保持心态: Unicode Consortium生成规范,而不是软件.这意味着每个软件供应商都可以尽可能准确地实现规范.因此,就像HTML,JavaScript,CSS,SQL等一样,不同平台,语言等之间存在差异.例如,我在Microsoft的.NET Framework中发现了一个错误,其中带圆圈的拉丁字母A-Z和 a-z- 代码点0x24B6到0x24E9 - 没有正确注册为char.IsLetter = true(这里的错误报告).这会导致相关功能出现意外行为,例如调用TextInfo.ToTitleCase()方法时(此处为错误报告).
Nay*_*ani 19
符号'123'实际上源自印地语(基本上来自梵文语言,即梵文),它代表数值,如:
1表示1
2代表2
而且很明智
| 归档时间: |
|
| 查看次数: |
14850 次 |
| 最近记录: |