为了匹配英语单词,我会使用模式[a-zA-Z]+
.
有没有办法如何编写一个与任何语言中的单词匹配的正则表达式?即使单词包含像这样的字符š?žé...
.我不知道世界上有哪些可能的角色,所以我不认为纯粹[a-zA-Zš?žé]+
就足够了......
有没有更好的方法来写这个表达式?
Mic*_*rdt 12
根据Pattern javadoc,\p{L}+
应匹配一系列Unicode字母(即Unicode中具有类别L的字符).这可能是最广泛的定义,但您可能需要查看unicode类别列表以决定是否要添加其他类别(例如,有一个名为"数字字母").