Python:从标签(gmail)下载所有电子邮件为pdf

Mag*_*Tun 6 python pdf download python-3.x gmail-api

我想从 gmail 下载 100 多封电子邮件的 pdf 格式。通过 gmail 中的打印选项手动下载所有内容会太长。

此 python 脚本检索所选标签中的电子邮件。我怎样才能把这封电子邮件转换成pdf文件。

# source  = https://developers.google.com/gmail/api/quickstart/python?authuser=2

from __future__ import print_function
import pickle
import os.path
from googleapiclient.discovery import build
from google_auth_oauthlib.flow import InstalledAppFlow
from google.auth.transport.requests import Request



SCOPES = ['https://www.googleapis.com/auth/gmail.readonly']

def main():
    creds = None

    if os.path.exists('token.pickle'):
        with open('token.pickle', 'rb') as token:
            creds = pickle.load(token)
    # If there are no (valid) credentials available, let the user log in.
    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file(
                'credentials.json', SCOPES)
            creds = flow.run_local_server()
        # Save the credentials for the next run
        with open('token.pickle', 'wb') as token:
            pickle.dump(creds, token)

    service = build('gmail', 'v1', credentials=creds)

    # Call the Gmail API 

    response= service.users().messages().list(userId="me", labelIds="Label_53", q=None, pageToken=None, maxResults=None, includeSpamTrash=None).execute()
    all_message_in_label = []
    if 'messages' in response:
        all_message_in_label.extend(response['messages'])

    while 'nextPageToken' in response:
      page_token = response['nextPageToken']
      response = service.users().messages().list(userId="me", labelIds="Label_53", q=None, pageToken=page_token, maxResults=None, includeSpamTrash=None).execute()
      all_message_in_label.extend(response['messages'])


    if not all_message_in_label:
        print('No email LM found.')
    else:
        # get message from Id listed in all_message_in_label
        for emails in all_message_in_label: 
            message= service.users().messages().get(userId="me", id=emails["id"], format="raw", metadataHeaders=None).execute()



if __name__ == '__main__':
    main()
Run Code Online (Sandbox Code Playgroud)

小智 3

我对您的问题进行了一些挖掘,发现了一些可能有用的链接:

关于将您的消息转换为此.eml链接的格式。

从这些链接转换.eml.pdf

eml2pdf是一个 python github 项目,它将eml文件转换为pdf但我不确定它是否有效。你可以检查一下它是否有效。

eml-to-pdf是另一个 github 项目,看起来较差但有效。它是用 JavaScript 编写的。

还有pyPdf可以用来生成pdf文件。不过,您可能需要自己转换电子邮件并格式化它们。

有关消息对象格式化的更多信息,您可以参考 gmail api python 文档get方法。

这是一篇博客文章它使用不同的方法完成您正在寻找的内容,尽管我不完全确定它是否仍然有效。

我希望它有帮助。祝你好运。