Lui*_*i87 0 email imap imaplib python-3.x
我需要过滤电子邮件并根据某些条件对其进行标记。
这是我的代码:
def get_inbox():
os.chdir("C:/Users/simeone/Desktop/FilterEmails")
df = {}
df = pd.read_excel("Filtri.xlsx", encoding='utf-8', sheet_name = ['FROM', 'TEXT', 'SUBJECT'])
filters = []
for key in df.keys():
fil = [ '(OR ' + key + ' ' + '"' + name + '"'+ ' UNSEEN)' for name in list(df[key][df[key].columns[0]])]
str1 = ' '.join(fil)
filters.append(str1)
filtro = ' '.join(filters)
mail = imaplib.IMAP4_SSL(host)
mail.login(username, password)
mail.select("inbox")
_, search_data = mail.search(None, filtro)
Run Code Online (Sandbox Code Playgroud)
代码不完整,但这不是重点,因为错误是条件。问题是条件。
我从 Excel 导入条件,其中条件分为来源、文本、主题,然后对它们施加条件。
问题在于代码会选择每封看不见的电子邮件,无论测试和主题如何。
我心里清楚逻辑,但无法正确翻译为代码。mail.search 必须做的是: AND UNSEEN AND (OR FROM "####" OR SUBJECT "####") 这意味着将所有未见过的内容贴上标签,并带有 OR “那个主题” OR他们来自“那个人”。
换句话说,标记所有来自 xxx 或主题为 xxx 但也是(且)未见过的内容。
在IMAP搜索语言中,AND是默认操作,并且OR是双操作数前缀操作。
因为AND你只需将它们粘在一起:“a 和 b”就是A B。
这OR意味着如果你想要“a 或 b”,你需要写“OR (A) (B)”。从技术上讲,括号并不是真正需要的,但如果您的条件变得复杂,括号可能会有所帮助。
如果您想要两个以上的东西,则需要将 OR 链接在一起。每个只能带两个参数。您可以将“x 或 y 或 z”写为OR (OR X Y) Z或OR X (OR Y Z)。同样,括号是可选的,但可能有助于某些服务器更好地解析它。
将所有这些粘在一起“a 和(x 或 y 或 z)”就是A OR OR X Y Z。
有很多服务器软件不能很好地处理复杂的查询。如果您的查询变得过于复杂或服务器实现很有限,您可能需要考虑自己缓存元数据(使用UID FETCH BODY[HEADER])并在本地进行搜索。该数据理论上是不可变的,因此您只需获取一次。