我正在尝试编写一个可以提取命令的正则表达式,这是到目前为止使用负向后置断言获得的结果:
\b(?<![@#\/])\w.*
Run Code Online (Sandbox Code Playgroud)
因此,输入:
/msg @nickname #channel foo bar baz
/foo #channel @nickname foo bar baz
foo bar baz
Run Code Online (Sandbox Code Playgroud)
foo bar baz每次都提取。参见工作示例
https://regex101.com/r/lF9aG7/3
但是在Go中,这不会编译http://play.golang.org/p/gkkVZgScS_
它抛出:
panic: regexp: Compile(`\b(?<![@#\/])\w.*`): error parsing regexp: invalid or unsupported Perl syntax: `(?<`
Run Code Online (Sandbox Code Playgroud)
我进行了一些研究,发现该语言不支持负向回溯以保证O(n)时间。
我该如何重写此正则表达式,以使其在没有负面效果的情况下完成相同的工作?
由于在否定后向查找中,您仅使用简单的字符集;您可以将其替换为否定字符集:
\b[^@#/]\w.*
Run Code Online (Sandbox Code Playgroud)
如果允许出现在字符串的开头,则使用锚点^:
(?:^|[^@#\/])\b\w.*
Run Code Online (Sandbox Code Playgroud)
根据您问题中的 Go Playground 链接中的示例,我认为您希望过滤掉以 中的字符开头的所有单词[#@/]。您可以使用一个filter函数:
func Filter(vs []string, f func(string) bool) []string {
vsf := make([]string, 0)
for _, v := range vs {
if f(v) {
vsf = append(vsf, v)
}
}
return vsf
}
Run Code Online (Sandbox Code Playgroud)
和一个Process使用上面过滤器的函数:
func Process(inp string) string {
t := strings.Split(inp, " ")
t = Filter(t, func(x string) bool {
return strings.Index(x, "#") != 0 &&
strings.Index(x, "@") != 0 &&
strings.Index(x, "/") != 0
})
return strings.Join(t, " ")
}
Run Code Online (Sandbox Code Playgroud)
可以在http://play.golang.org/p/ntJRNxJTxo的Playground上看到它的实际效果
| 归档时间: |
|
| 查看次数: |
3034 次 |
| 最近记录: |