uTu*_*Fan 13 java regex unicode character-properties
我遇到了一些包含的正则表达式[^\\p{L}]
.我知道这是使用某种形式的Unicode类别,但是当我检查文档时,我发现只有以下"L"类别:
Lu Uppercase letter UPPERCASE_LETTER
Ll Lowercase letter LOWERCASE_LETTER
Lt Titlecase letter TITLECASE_LETTER
Lm Modifier letter MODIFIER_LETTER
Lo Other letter OTHER_LETTER
Run Code Online (Sandbox Code Playgroud)
什么是L
在这种情况下?
Fav*_*ius 16
取自此链接:http://www.regular-expressions.info/unicode.html
检查Unicode Character Properties
部分.
\ p {L}匹配"字母"类别中的单个代码点.如果您的输入字符串是à编码为U + 0061 U + 0300,则它匹配没有重音的a.如果输入为à编码为U + 00E0,则它与重音符号相匹配.原因是代码点U + 0061(a)和U + 00E0(à)都在"字母"类别中,而U + 0300在"标记"类别中.