如何在Go中模拟负向后看

Yas*_*984 5 regex go

我正在尝试编写一个可以提取命令的正则表达式,这是到目前为止使用负向后置断言获得的结果:

\b(?<![@#\/])\w.*
Run Code Online (Sandbox Code Playgroud)

因此,输入:

/msg @nickname #channel foo bar baz
/foo #channel @nickname foo bar baz 
foo bar baz
Run Code Online (Sandbox Code Playgroud)

foo bar baz每次都提取。参见工作示例 https://regex101.com/r/lF9aG7/3

但是在Go中,这不会编译http://play.golang.org/p/gkkVZgScS_

它抛出:

panic: regexp: Compile(`\b(?<![@#\/])\w.*`): error parsing regexp: invalid or unsupported Perl syntax: `(?<`
Run Code Online (Sandbox Code Playgroud)

我进行了一些研究,发现该语言不支持负向回溯以保证O(n)时间。

我该如何重写此正则表达式,以使其在没有负面效果的情况下完成相同的工作?

hjp*_*r92 5

由于在否定后向查找中,您仅使用简单的字符集;您可以将其替换为否定字符集:

\b[^@#/]\w.*
Run Code Online (Sandbox Code Playgroud)

如果允许出现在字符串的开头,则使用锚点^

(?:^|[^@#\/])\b\w.*
Run Code Online (Sandbox Code Playgroud)

根据您问题中的 Go Playground 链接中的示例,我认为您希望过滤掉以 中的字符开头的所有单词[#@/]。您可以使用一个filter函数:

func Filter(vs []string, f func(string) bool) []string {
    vsf := make([]string, 0)
    for _, v := range vs {
        if f(v) {
            vsf = append(vsf, v)
        }
    }
    return vsf
}
Run Code Online (Sandbox Code Playgroud)

和一个Process使用上面过滤器的函数:

func Process(inp string) string {
    t := strings.Split(inp, " ")
    t = Filter(t, func(x string) bool {
        return strings.Index(x, "#") != 0 &&
            strings.Index(x, "@") != 0 &&
            strings.Index(x, "/") != 0
    })
    return strings.Join(t, " ")
}
Run Code Online (Sandbox Code Playgroud)

可以在http://play.golang.org/p/ntJRNxJTxo的Playground上看到它的实际效果

  • 看起来这就是他正在努力做的事情。至少这就是带有lookbehind的正则表达式正在做的事情。 (4认同)