Python正则表达式 - 如何从通配符表达式中捕获多个组?

Joh*_*n B 32 python regex lexical-analysis

我有一个Python正则表达式,其中包含一个可以出现零次或多次的组 - 但是当我之后检索组列表时,只有最后一个存在.例:

re.search("(\w)*", "abcdefg").groups()

这将返回列表('g',)

我需要它返回('a','b','c','d','e','f','g',)

那可能吗?我该怎么做?

Dou*_*der 39

re.findall(r"\w","abcdefg")
Run Code Online (Sandbox Code Playgroud)

  • +1:你不能用一个正则表达式捕获来做到这一点;你必须用另一种方式来做。 (2认同)

Tom*_*lak 30

除了Douglas Leeder的解决方案之外,还有以下解释:

在正则表达式中,组计数是固定的.将量词放在组后面不会增加组计数(想象所有其他组索引都会增加,因为一个更多的组匹配不止一次).

当需要多次匹配时,具有量词的组是使复杂子表达式成为原子的方式.正则表达式引擎除了将最后一个匹配仅保存到组之外别无他法.简而言之:用单一的"徒手"正则表达式无法达到你想要的效果,你必须找到另一种方式.

  • 为了记录,有一个Python的正则表达式实现,它还允许访问捕获组的所有匹配:http://pypi.python.org/pypi/regex (4认同)
  • 作为补充:现代正则表达式实现(如.NET中的那个)允许您访问除最后一个之外的组的先前出现.因此,上述陈述并非完全正确,但仍适用于大多数实现. (2认同)