OCR为图像提供叠加HTML?

Tra*_*ers 5 html ocr

我正在寻找一种OCR软件,可以将叠加HTML呈现给图像.我目前正在使用一些未命名的产品.它具有OCR功能,可以对带有图像的PDF文档进行内联OCR.

内联OCR非常方便,它允许使用图像搜索PDF文档.文本也可以直接在文档中突出显示,OCR文本与底层图像对齐.不幸的是,我可以从未命名的产品中导出或存储内联OCR.

是否有其他软件可以执行和导出内联OCR?我特别感兴趣的是导出到一个由定位的段落组成的HTML,这些段落与底层图像对齐.

另见:https:
//stackoverflow.com/questions/11404805/ocr-and-the-location-of-the-image-where-the-scanned-document-came-from

小智 2

我有一个可能的解决方案给你。但是,这个特定的解决方案有一些缺点,可能会阻碍您实现最终目标。

首先将图像文件转换为 pdf :http://finereader.abbyyonline.com 然后将 pdf 转换为 html http://document.online-convert.com/convert-to-html

该解决方案适用于纸张大小的问题,最终结果是带有图像覆盖的 html,如果您想要的只是带有图像格式的 html,只需使图像完全透明即可。