从 Databricks Notebook 发送带有附件的电子邮件

Dip*_*ick 5 email apache-spark pyspark databricks azure-databricks

我是 Python 和 Spark 世界的新手。我正在尝试构建一个 pyspark 代码以从 Databricks 发送电子邮件以及来自安装点位置的附件。我使用下面的代码来实现相同的 -

import smtplib
from pathlib import Path
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase
from email.mime.text import MIMEText
from email.utils import COMMASPACE, formatdate
from email import encoders


def send_mail(send_from = <from_email>, send_to = <to_email>, subject = "Test", message = "Test", files=["/mnt/<Mounted Point Directory>/"],
              server="<SMTP Host>", port=<SMTP Port>, username='<SMTP Username>', password='<SMTP Password>',
              use_tls=True):

    msg = MIMEMultipart()
    msg['From'] = send_from
    msg['To'] = COMMASPACE.join(send_to)
    msg['Date'] = formatdate(localtime=True)
    msg['Subject'] = subject

    msg.attach(MIMEText(message))

    for path in files:
        part = MIMEBase('application', "octet-stream")
        with open(path, 'rb') as file:
            part.set_payload(file.read())
        encoders.encode_base64(part)
        part.add_header('Content-Disposition',
                        'attachment; filename="{}"'.format(Path(path).name))
        msg.attach(part)

    smtp = smtplib.SMTP(server, port)
    if use_tls:
        smtp.starttls()
    smtp.login(username, password)
    smtp.sendmail(send_from, send_to, msg.as_string())
    smtp.quit()

Run Code Online (Sandbox Code Playgroud)

但由于某种原因,代码给了我文件或目录不存在异常。

我在这里错过了什么吗?

谢谢

Ale*_*Ott 7

您需要修改代码以使其与 DBFS 一起使用,因为该open函数不了解有关 DBFS 或其他文件系统的任何信息,并且只能与本地文件一起使用(请参阅有关 DBFS 的文档)。

您可以按照以下方式进行操作:

  • 如果您使用的是“完整 Databricks”,而不是社区版,那么您需要/dbfs在文件名前面添加 ,例如,/dbfs/mnt/....- 这种/dbfs挂载是从处理本地文件的代码访问 DBFS 上的文件的方式(但有一些写入该位置时的限制)。
  • 或者您可以使用dbutils.fs.cp 命令将文件从 DBFS 复制到本地文件,并使用该文件副本进行附加,如下所示:
dbutils.fs.cp("/mnt/...", "file:///tmp/local-name")
with open("/tmp/local-name", "r"):
...
Run Code Online (Sandbox Code Playgroud)