python regex:命名组中的重复名称

tsh*_*tsh 7 python regex regex-group regex-lookarounds

有没有办法在python中使用regex命名组中的相同名称?例如(?P<n>foo)|(?P<n>bar).

使用案例:我试图捕获typeid使用此正则表达式:
/(?=videos)((?P<type>videos)/(?P<id>\d+))|(?P<type>\w+)/?(?P<v>v)?/?(?P<id>\d+)?
从此字符串:

  • /信道/ V/123
  • / CH/V/41500082
  • /渠道
  • /视频/ 41500082

现在我收到错误: redefinition of group name 'id' as group 6; was group 3

Wik*_*żew 10

答案是:Python re不支持具有相同名称的组.

Python PyPi regex模块支持分支重置功能:

分支重置

(?|...|...)

捕获组编号将在备选方案中重复使用,但具有不同名称的组将具有不同的组编号.

例子:

>>> regex.match(r"(?|(first)|(second))", "first").groups()
('first',)
>>> regex.match(r"(?|(first)|(second))", "second").groups()
('second',)

请注意,只有一个组.

这是一个实时的Python 2.7演示:

import regex
s = "foo bar"
rx = regex.compile(r"(?P<n>foo)|(?P<n>bar)")
print([x.group("n") for x in rx.finditer(s)])
// => ['foo', 'bar']
Run Code Online (Sandbox Code Playgroud)