在 f.read 上过滤多个字符串

Question

在 f.read 上过滤多个字符串

我一直在尝试各种方法来过滤f.read(). 除了多个单独的循环之外，我似乎找不到一个能按我的预期工作的解决方案，但我拒绝相信没有更优雅的解决方案。

我正在尝试做类似的事情：

if 'string' or 'string2' or 'string3' in f.read():

Run Code Online (Sandbox Code Playgroud)

我尝试了一些变化，例如：

if ('string1', 'string2','string3') in f.read():

if f.read() ('string1', 'string2','string3'):

Run Code Online (Sandbox Code Playgroud)

当然，我还没有找到一种按照我期望的方式工作的方法，并且由于谷歌和文档都未能做到这一点，有人可以启发我吗？

经过 Kasramvd 的启发，下面的展示既优雅又实用。特别注意结局线。

check_list = ['string1', 'string2', 'string3']
for filename in files:
     f = open(root + filename)
     fi = f.read()
     if any(i in fi for i in check_list):

Run Code Online (Sandbox Code Playgroud)

Answer 1

Kas*_*mvd 5

您的第一个代码很接近，但您需要在or条件而不是对象之间使用，因此您可以将其更改为以下：

with open('file_name') as f:
    fi = f.read()
    if 'string' in fi or 'string2' in fi or 'string3' in fi:

Run Code Online (Sandbox Code Playgroud)

但您可以使用内置函数来代替any：

with open('file_name') as f:
    fi = f.read()
    if any(i in fi for i in word_set)

Run Code Online (Sandbox Code Playgroud)

如果您正在处理一个巨大的文件，而不是将整个文件内容加载到内存中，您可以使用函数检查每一行中是否存在字符串：

def my_func(word_set):
    with open('file_name') as f:
        for line in f:
            if any(i in line for i in word_set):
                return True
        return False

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，4 月前
查看次数：	358 次
最近记录：	10 年，4 月前