如何使用 Python 解析/读取 Outlook PST 文件?

Ulr*_*ich 6 python outlook pst

在 Internet 上搜索使用 Python 访问 Outlook PST 文件的结果很少(而且大多数显示的内容都已过时)。有谁知道如何在有或没有图书馆的情况下阅读 PST?不幸的是,我的编程能力不够好,无法在没有库的帮助下构建 PST 阅读器。

我的目标是获取有关内容的以下信息:

  • 每个文件夹的项目数
  • 项目类型(邮件、会议、联系人...)
  • 物品尺寸
  • 附件包括尺寸
  • 也许还有其他元数据,如日期、收件人等(可选)

我已经尝试过以下操作:

  1. libpff / pypff:崩溃并且似乎在执行某些操作之前读取内存中的整个文件(没有好的解决方案,因为 PST 文件保存在缓慢的网络存储上)。

  2. Libratom:与基于 libpff 的问题相同。

  3. Libpst:不清楚如何使用它/作为二进制文件提供(没有解释如何安装)/参见这篇文章的答案/似乎没有维护或更新。

  4. win32(在 Outlook 中安装 PST):一个教程展示了如何将 PST 安装到本地安装的 Outlook 中并通过 MAPI 访问获取内容,但这也非常非常慢,而且不是一个好的解决方案,因为需要 Outlook。

  5. Asponse Email Python:虽然文档不是很好,但一开始就有希望(没有 Python 示例/不同的命名,例如 PersonalStorage 对象和许多其他对象/每个文件夹 50 个项目后停止(可能是非免费版本的限制,但不清楚,因为出版商网站上缺乏解释)。

这是来自Asponse-website的示例:

personalStorage = PersonalStorage.from_file(dataDir + "Outlook.pst")

folderInfoCollection = personalStorage.root_folder.get_sub_folders()

for folderInfo in folderInfoCollection:

    print("Folder: " + folderInfo.display_name)
    print("Total Items: " + str(folderInfo.content_count))
    print("Total Unread Items: " + str(folderInfo.content_unread_count))
    print("----------------------")
Run Code Online (Sandbox Code Playgroud)

我进行了大量的谷歌搜索,找到了合适的导入语句来进行这次运行。

有人有稳定清晰的方法来读取 Outlook PST 文件吗?即使使用 Asponse 的解决方案也足以超过 50 个项目的限制。

Dmi*_*nko 1

Redemption(我是它的作者)可以是另一种选择 - 它是扩展 MAPI 的包装器,因此您仍然需要安装 Outlook(用于其 MAPI 系统),但与 Outlook 对象模型不同,它可以从服务中使用,并且不需要启动 Outlook.exe 和/或将 PST 文件添加到用户的默认配置文件中。您可以使用RDOSession之一。LogonPstStore(它创建并删除配置为使用指定 PST 文件的临时配置文件)和/或RDOSession.Stores.AddPstStore将 PST 文件添加到现有会话(例如,由 Outlook 使用或由 创建LogonPstStore)。