快速的 Python PDF 元数据阅读器

ian*_*aré 5 python pdf metadata

我正在寻找一个非常快速、轻量级的 Python 库来读取 PDF 元数据。我不需要任何写入能力。如果只加载元数据信息而不是整个文件会更好。

我意识到像 Python 这样的解释型语言并不是提高速度的最佳选择,但由于该解决方案需要跨平台并与现有的 Python 应用程序一起使用,因此似乎没有太多选择。

我查看了 pyPdf 和其他一些库,但理想情况下,我正在寻找更轻、更快、适合一次性处理数万个文件的东西。

ale*_*xis 0

您看过类似问题的答案吗它建议使用fopen并手动解析元数据。如果元数据就是您所需要的,您可以自己解析它并使其尽可能快。