正则表达式 - 在两个不包含单词的单词之间获取字符串

如果字符串中有多个`START ... END`对,则会失败.(或者更确切地说,它只会在字符串中找到最后一个`START ... END`对.) (2认同)
为了澄清蒂姆的评论：如果“START”*任何*第二次出现，无论是*之前*还是*之后*“END”，您的正则表达式将不会匹配您期望的位置（例如“abcSTARTabcENDxyzSTART”将不匹配） (2认同)

Answer 2

Tim*_*ker 6

START(?:(?!START).)*END

Run Code Online (Sandbox Code Playgroud)

将适用于任意数量的START...END对。在 Python 中演示：

>>> import re
>>> a = "abcSTARTdefENDghiSTARTjlkENDopqSTARTrstSTARTuvwENDxyz"
>>> re.findall(r"START(?:(?!START).)*END", a)
['STARTdefEND', 'STARTjlkEND', 'STARTuvwEND']

Run Code Online (Sandbox Code Playgroud)

如果您只关心START和之间的内容END，请使用：

(?<=START)(?:(?!START).)*(?=END)

Run Code Online (Sandbox Code Playgroud)

在这里看到它：

>>> re.findall(r"(?<=START)(?:(?!START).)*(?=END)", a)
['def', 'jlk', 'uvw']

Run Code Online (Sandbox Code Playgroud)

Answer 3

tri*_*eee 4

真正行人的解决方案是START(([^S]|S*S[^ST]|ST[^A]|STA[^R]|STAR[^T])*(S(T(AR?)?)?)?)END。现代正则表达式风格有负面断言，可以更优雅地做到这一点，但我将您对“向后搜索”的评论解释为可能意味着您不能或不想使用此功能。

错误修复：此答案的先前版本有一个错误，因为它SSTART可能是匹配的一部分（第二个S将匹配[^T]，等等）。我修复了这个问题，但通过添加Sin并在非可选之前[^ST]添加，以允许任意重复其他内容。S*SS

归档时间：	14 年，5 月前
查看次数：	2851 次
最近记录：	8 年，8 月前