如何捕获正则表达式交替的匹配组与拆分？

Question

我有一个字符串

my $foo = 'one#two#three!four#five#six';

从中我想要提取由a #或a 分隔的部分!.这很容易split:

my @parts = split /#|!/, $foo;

另外一个要求是我还需要捕获感叹号.所以我试过了

my @parts = split /#|(!)/, $foo;

然而,这会返回一个undef值或感叹号(在拆分规范中也明确说明).

所以,我用以下方法清除了不需要的undef值grep:

my @parts = grep { defined } split /#|(!)/, $foo;

这就是我想要的.

然而,我想知道我是否可以以某种方式更改正则表达式,以便我不必也调用grep.

Answer 1

使用时split,一旦找到匹配项,您可能不会省略空捕获(因为匹配中的捕获总是与正则表达式中定义的一样多).不过,您可以在此处使用匹配方法:

my @parts = $foo =~ /[^!#]+|!/g;

这样一来,你会匹配1个或更多字符以外的!和#(与[^!#]+二选一),或一个感叹号,多次(/g).