使用正则表达式进行数学集验证

unm*_*use 8 java regex

我需要验证给定String的用户并验证它是否是有效的Set,可能是包含内部集的集合.例子:

 1) {1, 2, 3, 4} = valid
 2) {1, 2, {3, 4}, 5} = valid
 3) 1, 2, 3, 4 = invalid (missing brackets)
 4) {1, 2, {3, 4, 5} = invalid (missing inner bracket)
Run Code Online (Sandbox Code Playgroud)

这是我正在使用的正则表达式(为便于阅读而分解):

String elementSeparator = "(,\\s)?";
String validElement = "(\\{?[A-Za-z0-9]*\\}?" + elementSeparator + ")*";
String regex = "^\\{" + validElement + "\\}$";
Run Code Online (Sandbox Code Playgroud)

目前它接受带有可选开始和结束括号的集合,但我需要它只接受它们是否存在,而不是如果内部集合缺少一个括号.在我当前的实现中,第4个示例被接受为有效集.

我怎么能做到这一点?

Jim*_*son 4

下面是一些 Java 伪代码,说明如何在不使用任何重量级工具(例如 ANTLR)的情况下解决此问题。基本方法是将输入拆分为由以下组成的标记

  1. 单个左大括号或右大括号
  2. 一个逗号
  3. 空白
  4. 一个标识符

然后,您扫描令牌,同时跟踪嵌套级别。如果到达末尾时嵌套级别不为零,则输入字符串的大括号不平衡。

Pattern token = Pattern.compile("([{}]|,|[A-Aa-z0-9]+|\s+)");
int nesting = 0
Matcher m = token.matcher(inputString);
while(m.find())
{
    if (m.group(1).equals("{")
        nesting++;
    else if (m.group(1).equals("}")
    {
        nesting--;
        if (nesting < 0)
            error - too many right braces
    }
    else
        ....
}
if (nesting != 0) 
    log("incorrect nesting");
Run Code Online (Sandbox Code Playgroud)

一旦你有了这个框架,你就可以增强它来检测诸如连续两个逗号之类的东西:当你看到逗号时设置一个标志,当你看到标识符(但不是空格)时清除标志。在逗号和右大括号的分支中,您测试标志并发出错误消息,因为此时的逗号无效。等等,无论您需要什么验证。

请注意,我上面的伪代码不是完整的解决方案,只是为了给您提供一般方法。完整的解决方案会更加复杂,因为它必须处理无效字符,从而使词法分析器(将字符串分解为标记的部分)更加复杂。

  • 另外不要忘记确保 `nesting` 始终为正,因此它不会验证 `"} {"` (3认同)
  • 注意:您应该检查循环中的负嵌套级别!否则,它可能接受“}{”。 (2认同)