相关疑难解决方法(0)

Java正则表达式中\ w和\ b的Unicode等价物?

许多现代正则表达式实现将\w字符类简写解释为"任何字母,数字或连接标点符号"(通常为下划线).这样一来,像一个正则表达式\w+像火柴的话hello,élève,GOÄ_432gefräßig.

不幸的是,Java没有.在Java中,\w仅限于[A-Za-z0-9_].这使得像上述那些匹配的单词难以解决.

似乎\b单词分隔符在不应该的位置匹配.

什么是类似.NET,Unicode感知\w\bJava 的正确等价物?哪些其他快捷方式需要"重写"以使其具有Unicode感知功能?

java regex unicode character-properties

124
推荐指数
3
解决办法
6万
查看次数

标签 统计

character-properties ×1

java ×1

regex ×1

unicode ×1