在 f.read 上过滤多个字符串

iNo*_*oob 1 python python-2.7

我一直在尝试各种方法来过滤f.read(). 除了多个单独的循环之外,我似乎找不到一个能按我的预期工作的解决方案,但我拒绝相信没有更优雅的解决方案。

我正在尝试做类似的事情:

if 'string' or 'string2' or 'string3' in f.read():
Run Code Online (Sandbox Code Playgroud)

我尝试了一些变化,例如:

if ('string1', 'string2','string3') in f.read():

if f.read() ('string1', 'string2','string3'):
Run Code Online (Sandbox Code Playgroud)

当然,我还没有找到一种按照我期望的方式工作的方法,并且由于谷歌和文档都未能做到这一点,有人可以启发我吗?

经过 Kasramvd 的启发,下面的展示既优雅又实用。特别注意结局线。

check_list = ['string1', 'string2', 'string3']
for filename in files:
     f = open(root + filename)
     fi = f.read()
     if any(i in fi for i in check_list):
Run Code Online (Sandbox Code Playgroud)

Kas*_*mvd 5

您的第一个代码很接近,但您需要在or条件而不是对象之间使用,因此您可以将其更改为以下:

with open('file_name') as f:
    fi = f.read()
    if 'string' in fi or 'string2' in fi or 'string3' in fi:
Run Code Online (Sandbox Code Playgroud)

但您可以使用内置函数来代替any

with open('file_name') as f:
    fi = f.read()
    if any(i in fi for i in word_set)
Run Code Online (Sandbox Code Playgroud)

如果您正在处理一个巨大的文件,而不是将整个文件内容加载到内存中,您可以使用函数检查每一行中是否存在字符串:

def my_func(word_set):
    with open('file_name') as f:
        for line in f:
            if any(i in line for i in word_set):
                return True
        return False
Run Code Online (Sandbox Code Playgroud)