Boh*_*ian 7 java regex character-class
......用于像"\\p{someCharacterClass}"
.
我用过/见过一些:
所有受支持的内置角色的最终列表是什么?它在哪里记录?具体含义是什么?
似乎有很多"RTFM"答案引用了javadoc Pattern
.这是我在问这个问题之前看到的第一个地方.就这样每个人都很清楚,Pattern的javadoc没有提到上面列出的任何类.
"正确"的答案将在页面的某处提及"InCombiningDiacriticalMarks",并且不会对"Unicode标准"进行模糊的引用.
Gre*_*ill 10
在对文件Pattern
说,"Unicode支持"部分:
支持的类别是由Character类指定的版本中的Unicode标准类别.类别名称是标准中定义的类别,包括规范性和信息性.Pattern支持的块名称是接受和定义的有效块名称
UnicodeBlock.forName
.
块名称由Unicode标准确定.
在http://unicode.org上有FAQ 我在哪里可以找到Unicode块的权威列表?:
答:Unicode块及其名称是Unicode标准的标准部分.确切的名单始终保持在的文件中的一个Unicode字符数据库,
Blocks.txt
.
最后,Blocks.txt
有一条线:
0300..036F; Combining Diacritical Marks
这些字符可以在组合变音符号代码表(来自Unicode 6.0字符代码表)中找到.