Java支持条件前瞻

Cra*_*lus 4 java regex regex-lookarounds

在下面让我们说邮政编码,我试图33333-从结果中排除.
我做:

String zip = "11111 22222 33333- 44444-4444";
String regex = "\\d{5}(?(?=-)-\\d{4})";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(zip);
while (matcher.find()) { 
   System.out.println(" Found: " + matcher.group());     
}
Run Code Online (Sandbox Code Playgroud)

期望获得:

Found:  11111  
Found:  22222  
Found:  44444-4444
Run Code Online (Sandbox Code Playgroud)

我试图强制执行以下格式:
5位数字后跟一个 - 和4位数字.只需要一个 - (连字符)的5位数字

我得到例外:

Exception in thread "main" java.util.regex.PatternSyntaxException: Unknown inline modifier near index 7
\d{5}(?(?=-)(-\d{4}))
       ^
    at java.util.regex.Pattern.error(Unknown Source)
    at java.util.regex.Pattern.group0(Unknown Source)
    at java.util.regex.Pattern.sequence(Unknown Source)
    at java.util.regex.Pattern.expr(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)
    at java.util.regex.Pattern.<init>(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)
Run Code Online (Sandbox Code Playgroud)

我没有正确使用条件前瞻吗?

anu*_*ava 6

要捕获除33333之外的所有数字,请使用以下代码:

String zip = "11111 22222 33333- 44444-4444";
String regex = "\\d{5}(?=(-\\d{4}|\\s|$))(-\\d{4})?";
Matcher m = Pattern.compile(regex).matcher(zip);
while(m.find())
    System.out.printf("Macthed: [%s]%n", m.group(1));
Run Code Online (Sandbox Code Playgroud)

OUTPUT:

Macthed: [11111]
Macthed: [22222]
Macthed: [44444-4444]
Run Code Online (Sandbox Code Playgroud)

说明:此RegEx使用前瞻,它本身就像一个条件,这意味着匹配5位数字,必须跟随 - 和4位数字或空格或字符串结尾,然后它可选择匹配文本 - 和4位数字.

您的原始RegEx之所以抛出异常,是因为?:(?=-)您的RegEx部分存在语法错误.