标签: character-class

String number = "703-463-9281";
String number2 = number.replaceAll("[0-9]!", ""); // produces: "703-463-9281" (no change)
String number3 = number.replaceAll("[0-9]", "");  // produces: "--" 
String number4 = number.replaceAll("![0-9]", ""); // produces: "703-463-9281" (no change)
String number6 = number.replaceAll("^[0-9]", ""); // produces: "03-463-9281"

Run Code Online (Sandbox Code Playgroud)

java regex character-class

Chr*_*row

2010 10-03

26
推荐指数

2
解决办法

3万
查看次数

使用Java regexp匹配(例如)Unicode字母

StackOverflow上有许多问题和答案,假设"字母"可以在正则表达式中匹配[a-zA-Z].然而,对于Unicode,还有更多的字符,大多数人会认为是一个字母(所有希腊字母,Cyrllic ..还有更多.Unicode定义了许多块,每个块可能有"字母".

Java定义为像alpha字符这样的东西定义了Posix类,但是它被指定为仅使用US-ASCII.预定义的字符类定义要包含的单词[a-zA-Z_0-9],这也排除了许多字母.

那么如何正确匹配Unicode字符串呢？是否有其他图书馆可以做到这一点？

java regex unicode character-class character-properties

The*_*aul

2012 03-30

14
推荐指数

2
解决办法

2万
查看次数

从字符类中排除字符

是否有一种简单的方法来匹配类中除了某些特定组之外的所有字符？例如,如果在我可以使用\ w来匹配所有unicode单词字符集的语言中,有没有办法从该匹配中排除像下划线"_"这样的字符？

只有想到的想法是在每个角色周围使用负向前瞻/后面,但是当我有效地想要将角色与正匹配和负匹配匹配时,这似乎比必要更复杂.例如,如果&是一个AND运算符,我可以这样做......

^(\w&[^_])+$

Run Code Online (Sandbox Code Playgroud)

regex set-difference character-class

Dan*_*rts

2018 09-13

14
推荐指数

5
解决办法

6377
查看次数

(相当于)"字符类中的反向引用"的一般方法？

在Perl的正则表达式,如表达式\1,\2等通常解释为"反向引用"到先前捕获的组,但不因此当\1,\2等字符类内出现.在后一种情况下,它\被视为转义字符(因此\1只是1等).

因此,如果(例如)想要匹配一个字符串(长度大于1),其第一个字符与其最后一个字符匹配,但不出现在字符串中的任何其他位置,则以下正则表达式不会:

/\A       # match beginning of string;
 (.)      # match and capture first character (referred to subsequently by \1);
 [^\1]*   # (WRONG) match zero or more characters different from character in \1;
 \1       # match \1;
 \z       # match the end of the string;
/sx       # s: let . match newline; x: ignore whitespace, allow comments

Run Code Online (Sandbox Code Playgroud)

将不工作,因为它匹配(例如)字符串'a1a2a':

  DB<1> ( …

Run Code Online (Sandbox Code Playgroud)

regex perl backreference character-class

kjo*_*kjo

lucky-day

13
推荐指数

1
解决办法

1021
查看次数

字符类减法,从Java语法转换为RegexBuddy

Java使用哪个正则表达式引擎？

在像RegexBuddy这样的工具中使用

[a-z&&[^bc]]

Run Code Online (Sandbox Code Playgroud)

Java中的表达式很好,但在RegexBuddy中它还没有被理解.

事实上,它报道:

匹配下面列表中的单个字符 [a-z&&[^bc]

范围在a和之间的字符z:a-z

其中一个人物&[^bc:&&[^bc

]字面匹配字符:]

但我想匹配一个字符,a并z与一个不是b或的字符相交c

java regex regexbuddy character-class

xde*_*000

2010 07-09

12
推荐指数

1
解决办法

4041
查看次数

为什么字符类比交替更快？

似乎使用一个字符类比一个例子中的交替更快,比如:
[abc]vs (a|b|c)
我听说它被推荐,并且使用Time::HiRes我验证的简单测试(慢10倍).在捕获括号产生差异的情况下
也使用(?:a|b|c)不会改变结果.
但我不明白为什么.我认为这是因为回溯,但我在每个位置看到它的方式有3个字符比较所以我不确定回溯是如何影响交替的.这是实施交替性质的结果吗？

regex perl performance character-class regex-alternation

Jim*_*Jim

2014 10-01

12
推荐指数

2
解决办法

1082
查看次数