我正在尝试将多个 pdf(10k +)转换为 jpg 图像并从中提取文本。我目前正在使用pdf2imagepython 库,但它相当慢,有没有比这更快/最快的库?
from pdf2image import convert_from_bytes
images = convert_from_bytes(open(path,"rb").read())
Run Code Online (Sandbox Code Playgroud)
注意:我使用的是 ubantu 18.04
CPU:4 核 8 线程(ryzen 3 3100)
内存:8 GB