正则表达式返回两个特殊字符之间的所有字符

use*_*161 21 python regex parsing

我如何使用regx返回两个括号之间的所有字符.这是一个例子:

foobar['infoNeededHere']ddd
needs to return infoNeededHere
Run Code Online (Sandbox Code Playgroud)

我在大括号之间找到了一个正则表达式,但所有尝试使用方括号的尝试都失败了.这是正则表达式:(?<={)[^}]*(?=})这是我试图破解它

(?<=[)[^}]*(?=])
Run Code Online (Sandbox Code Playgroud)

最终解决方案

import re

str = "foobar['InfoNeeded'],"
match = re.match(r"^.*\['(.*)'\].*$",str)
print match.group(1)
Run Code Online (Sandbox Code Playgroud)

Yat*_*wal 31

如果您是REG(gular)EX(新闻)的新手,您可以在Python Docs中了解它们.或者,如果您想要更温和的介绍,可以查看HOWTO.他们使用Perl风格的语法.

正则表达式

你需要的表达是.*?\[(.*)\].*.你想要的那个团体\1.
- .*?: .匹配除换行符之外的任何字符.*是一个元字符,意味着重复这个0次或更多次.?使*非贪婪,即.在击中'['之前,将尽可能少的字符匹配.
- \[: \转义特殊元字符,在本例中为[.如果我们不这样做,[会做一些非常奇怪的事情.
- (.*): 括号'分组'其中的任何内容,您可以稍后通过其数字ID或名称检索组(如果给它们一个).
- \].*: 你现在应该足够了解这意味着什么.

履行

首先,将re模块 - 它不是内置的 - 导入到您希望使用表达式的位置.

然后,用于re.search(regex_pattern, string_to_be_tested)搜索要测试的字符串中的模式.这将返回一个MatchObject可以存储到临时变量的.然后,您应该调用它的group()方法并将1作为参数传递(以查看我们之前使用括号捕获的"组1").我现在应该看起来像:

>>> import re
>>> pat = r'.*?\[(.*)].*'             #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd"
>>> match = re.search(pat, s)
>>> match.group(1)
"'infoNeededHere'"
Run Code Online (Sandbox Code Playgroud)

替代

您还可以findall()通过修改正则表达式来查找所有非重叠匹配(?>=\[).+?(?=\]).
- (?<=\[): (?<=)被称为后视断言并检查实际匹配之前的表达式.
- .+?: +就像*它匹配一个或多个repititions一样.它是非贪婪的?.
- (?=\]): (?=)是look- 提前判断和检查的表达以下的匹配的w/o捕获它.
您的代码现在应该如下所示:

>>> import re
>>> pat = r'(?<=\[).+?(?=\])'  #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd[andHere] [andOverHereToo[]"
>>> re.findall(pat, s)
["'infoNeededHere'", 'andHere', 'andOverHereToo['] 
Run Code Online (Sandbox Code Playgroud)

注意:始终使用原始Python字符串,方法是在字符串前添加"r"(例如:) r'blah blah blah'.

10倍阅读!当没有被接受的时候我写了这个答案,但是当我完成它的时候,有2个矿石出现了,一个被接受了.:( x <


小智 23

^.*\['(.*)'\].*$ 将匹配一条线并捕获您想要的组.

你必须逃脱[,并]\

rubular.com 证明链接中的文档将解释表达式是如何形成的.


Li-*_*Yip 10

如果[.....]每行只有一个这样的令牌,那么你根本不需要使用正则表达式:

In [7]: mystring = "Bacon, [eggs], and spam"

In [8]: mystring[ mystring.find("[")+1 : mystring.find("]") ]
Out[8]: 'eggs'
Run Code Online (Sandbox Code Playgroud)

如果每行中有多个这些,那么你需要修改Jarrod的正则表达式^.*\['(.*)'\].*$以匹配每行多次,并且非贪婪.(使用.*?量词而不是.*量词.)

In [15]: mystring = "[Bacon], [eggs], and [spam]."

In [16]: re.findall(r"\[(.*?)\]",mystring)
Out[16]: ['Bacon', 'eggs', 'spam']
Run Code Online (Sandbox Code Playgroud)