我的背景
我正在使用 tesseract 从图像中提取文本。
我正在生成一个.tsv来检索提取的文本并对其执行一些正则表达式,并生成一个.pdf以获得可搜索的 pdf。
我的方法是调用 tesseract 两次:
但我觉得这不是很有效(相同的计算必须进行两次)
我的愿望是什么
我希望让我的计算速度更快。我的想法是只调用一次 tesseract 但指定两种输出格式
是否可以?如果是这样怎么办?
| 归档时间: |
|
| 查看次数: |
2949 次 |
| 最近记录: |