任何语言的单词字符的正则表达式

dot*_*hen 9 php regex

测试PHP正则表达式引擎,我发现它只考虑[0-9A-Za-z_]单词字符.非ASCII语言(如希伯来语)的字母不与字符匹配[\w].是否有任何PHP或Perl正则表达式转义序列符合任何语言的字母?我可以为每个我期望使用的字母添加范围,但是用户总是会用意想不到的语言给我们带来惊喜!

请注意,这不是用于安全过滤,而是用于标记文本.