我试图用正则表达式(RE)解析大量的文本文件样本.我试图从这些文件中提取包含'vu'的文本部分,并以换行符'\n'结尾.
模式因文件而异,因此我尝试使用OR运算符在文件中查找RE的组合.但是,我找不到自动化代码的方法,以便re.findall()函数查找RE的组合.
这是我试图解决这个问题的一个例子,但显然我仍然无法在re.findall()中评估我的正则表达式和OR运算符:
import re
def series2string(myserie) :
myserie2 = ' or '.join(serie for serie in myserie)
return myserie2
def expression(pattern, mystring) :
x = re.findall(pattern, mystring)
if len(x)>0:
return 1
else:
return 0
#text example
text = "\n\n (troisième chambre)\n i - vu la requête, enregistrée le 28 février 1997 sous le n° 97nc00465, présentée pour m. z... farinez, demeurant ... à dommartin-aux-bois (vosges), par me y..., avocat ;\n" …Run Code Online (Sandbox Code Playgroud)