相关疑难解决方法(0)

使用Java regexp匹配(例如)Unicode字母

StackOverflow上有许多问题和答案,假设"字母"可以在正则表达式中匹配[a-zA-Z].然而,对于Unicode,还有更多的字符,大多数人会认为是一个字母(所有希腊字母,Cyrllic ..还有更多.Unicode定义了许多块,每个可能有"字母".

Java定义 为像alpha字符这样的东西定义了Posix类,但是它被指定为仅使用US-ASCII.预定义的字符类定义要包含的单词[a-zA-Z_0-9],这也排除了许多字母.

那么如何正确匹配Unicode字符串呢?是否有其他图书馆可以做到这一点?

java regex unicode character-class character-properties

14
推荐指数
2
解决办法
2万
查看次数