Java支持哪些内置的正则表达式字符类

Boh*_*ian 7 java regex character-class

......用于像"\\p{someCharacterClass}".
我用过/见过一些:

  • 降低
  • InCombiningDiacriticalMarks
  • ASCII

所有受支持的内置角色的最终列表是什么?它在哪里记录?具体含义是什么?

编辑...

似乎有很多"RTFM"答案引用了javadoc Pattern.这是我在问这个问题之前看到的第一个地方.就这样每个人都很清楚,Pattern的javadoc没有提到上面列出的任何类.

"正确"的答案将在页面的某处提及"InCombiningDiacriticalMarks",并且不会对"Unicode标准"进行模糊的引用.

Gre*_*ill 10

对文件Pattern说,"Unicode支持"部分:

支持的类别是由Character类指定的版本中的Unicode标准类别.类别名称是标准中定义的类别,包括规范性和信息性.Pattern支持的块名称是接受和定义的有效块名称UnicodeBlock.forName.

各州的文件UnicodeBlock.forName:

块名称由Unicode标准确定.

http://unicode.org上有FAQ 我在哪里可以找到Unicode块的权威列表?:

答:Unicode块及其名称是Unicode标准的标准部分.确切的名单始终保持在的文件中的一个Unicode字符数据库,Blocks.txt.

最后,Blocks.txt有一条线:

0300..036F; Combining Diacritical Marks

这些字符可以在组合变音符号代码表(来自Unicode 6.0字符代码表)中找到.