我一直在尝试各种方法来过滤f.read(). 除了多个单独的循环之外,我似乎找不到一个能按我的预期工作的解决方案,但我拒绝相信没有更优雅的解决方案。
我正在尝试做类似的事情:
if 'string' or 'string2' or 'string3' in f.read():
Run Code Online (Sandbox Code Playgroud)
我尝试了一些变化,例如:
if ('string1', 'string2','string3') in f.read():
if f.read() ('string1', 'string2','string3'):
Run Code Online (Sandbox Code Playgroud)
当然,我还没有找到一种按照我期望的方式工作的方法,并且由于谷歌和文档都未能做到这一点,有人可以启发我吗?
经过 Kasramvd 的启发,下面的展示既优雅又实用。特别注意结局线。
check_list = ['string1', 'string2', 'string3']
for filename in files:
f = open(root + filename)
fi = f.read()
if any(i in fi for i in check_list):
Run Code Online (Sandbox Code Playgroud)
您的第一个代码很接近,但您需要在or条件而不是对象之间使用,因此您可以将其更改为以下:
with open('file_name') as f:
fi = f.read()
if 'string' in fi or 'string2' in fi or 'string3' in fi:
Run Code Online (Sandbox Code Playgroud)
但您可以使用内置函数来代替any:
with open('file_name') as f:
fi = f.read()
if any(i in fi for i in word_set)
Run Code Online (Sandbox Code Playgroud)
如果您正在处理一个巨大的文件,而不是将整个文件内容加载到内存中,您可以使用函数检查每一行中是否存在字符串:
def my_func(word_set):
with open('file_name') as f:
for line in f:
if any(i in line for i in word_set):
return True
return False
Run Code Online (Sandbox Code Playgroud)