小编Sah*_*iya的帖子

我正在尝试将多个 pdf（10k +）转换为 jpg 图像并从中提取文本。我目前正在使用pdf2imagepython 库，但它相当慢，有没有比这更快/最快的库？

from pdf2image import convert_from_bytes
images = convert_from_bytes(open(path,"rb").read())

注意：我使用的是 ubantu 18.04
CPU：4 核 8 线程（ryzen 3 3100）
内存：8 GB

2
推荐指数

1
解决办法

5671
查看次数

小编Sah_iya的帖子