use*_*161 21 python regex parsing
我如何使用regx返回两个括号之间的所有字符.这是一个例子:
foobar['infoNeededHere']ddd
needs to return infoNeededHere
Run Code Online (Sandbox Code Playgroud)
我在大括号之间找到了一个正则表达式,但所有尝试使用方括号的尝试都失败了.这是正则表达式:(?<={)[^}]*(?=})这是我试图破解它
(?<=[)[^}]*(?=])
Run Code Online (Sandbox Code Playgroud)
最终解决方案
import re
str = "foobar['InfoNeeded'],"
match = re.match(r"^.*\['(.*)'\].*$",str)
print match.group(1)
Run Code Online (Sandbox Code Playgroud)
Yat*_*wal 31
如果您是REG(gular)EX(新闻)的新手,您可以在Python Docs中了解它们.或者,如果您想要更温和的介绍,可以查看HOWTO.他们使用Perl风格的语法.
你需要的表达是.*?\[(.*)\].*.你想要的那个团体\1.
- .*?: .匹配除换行符之外的任何字符.*是一个元字符,意味着重复这个0次或更多次.?使*非贪婪,即.在击中'['之前,将尽可能少的字符匹配.
- \[: \转义特殊元字符,在本例中为[.如果我们不这样做,[会做一些非常奇怪的事情.
- (.*): 括号'分组'其中的任何内容,您可以稍后通过其数字ID或名称检索组(如果给它们一个).
- \].*: 你现在应该足够了解这意味着什么.
首先,将re模块 - 它不是内置的 - 导入到您希望使用表达式的位置.
然后,用于re.search(regex_pattern, string_to_be_tested)搜索要测试的字符串中的模式.这将返回一个MatchObject可以存储到临时变量的.然后,您应该调用它的group()方法并将1作为参数传递(以查看我们之前使用括号捕获的"组1").我现在应该看起来像:
>>> import re
>>> pat = r'.*?\[(.*)].*' #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd"
>>> match = re.search(pat, s)
>>> match.group(1)
"'infoNeededHere'"
Run Code Online (Sandbox Code Playgroud)
您还可以findall()通过修改正则表达式来查找所有非重叠匹配(?>=\[).+?(?=\]).
- (?<=\[): (?<=)被称为后视断言并检查实际匹配之前的表达式.
- .+?: +就像*它匹配一个或多个repititions一样.它是非贪婪的?.
- (?=\]): (?=)是look- 提前判断和检查的表达以下的匹配的w/o捕获它.
您的代码现在应该如下所示:
>>> import re
>>> pat = r'(?<=\[).+?(?=\])' #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd[andHere] [andOverHereToo[]"
>>> re.findall(pat, s)
["'infoNeededHere'", 'andHere', 'andOverHereToo[']
Run Code Online (Sandbox Code Playgroud)
注意:始终使用原始Python字符串,方法是在字符串前添加"r"(例如:) r'blah blah blah'.
10倍阅读!当没有被接受的时候我写了这个答案,但是当我完成它的时候,有2个矿石出现了,一个被接受了.:( x <
Li-*_*Yip 10
如果[.....]每行只有一个这样的令牌,那么你根本不需要使用正则表达式:
In [7]: mystring = "Bacon, [eggs], and spam"
In [8]: mystring[ mystring.find("[")+1 : mystring.find("]") ]
Out[8]: 'eggs'
Run Code Online (Sandbox Code Playgroud)
如果每行中有多个这些,那么你需要修改Jarrod的正则表达式^.*\['(.*)'\].*$以匹配每行多次,并且非贪婪.(使用.*?量词而不是.*量词.)
In [15]: mystring = "[Bacon], [eggs], and [spam]."
In [16]: re.findall(r"\[(.*?)\]",mystring)
Out[16]: ['Bacon', 'eggs', 'spam']
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
69764 次 |
| 最近记录: |