如何创建一个与任何语言的单词匹配的java正则表达式

Pal*_*alo 7 java regex

为了匹配英语单词,我会使用模式[a-zA-Z]+.

有没有办法如何编写一个与任何语言中的单词匹配的正则表达式?即使单词包含像这样的字符š?žé....我不知道世界上有哪些可能的角色,所以我不认为纯粹[a-zA-Zš?žé]+就足够了......

有没有更好的方法来写这个表达式?

Mic*_*rdt 12

根据Pattern javadoc,\p{L}+应匹配一系列Unicode字母(即Unicode中具有类别L的字符).这可能是最广泛的定义,但您可能需要查看unicode类别列表以决定是否要添加其他类别(例如,有一个名为"数字字母").