我想从 .jpg 和 .png 文件中提取 Unicode 字符。
我尝试使用以下命令来做到这一点:
tesseract 1.png output.txt
Run Code Online (Sandbox Code Playgroud)
该命令适用于英文字符,但是当我尝试将它用于 Unicode(如印地语、马拉地语或梵文脚本)时,它会产生错误的输出。
是否有任何选项可以使用 OCR 将 Unicode(梵文)脚本提取到文本文件中?
我试过使用组合
我不确定 ZoHoViewer 产品的好坏,但以下几点:
Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von
变成:
AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag,dieVermittelbarkeit vonSt...
因此,goog docs 使尝试翻译它成为猪的早餐。
有没有人有更好的建议(最好是免费的在线服务)
当我们购买大量乐透彩票时,有没有办法将所有这些数字读入电子表格,以便可以通过公式/宏与中奖号码进行核对?
我正在寻找一个 OCR 应用程序,它可以读取扫描的 PDF/JPG 文件并将它们转储到一个文件中。(这可能不仅适用于乐透,也适用于其他扫描文件。)至于检查中奖号码,一旦我将它们保存在 CSV/XLS 文件中,我就知道如何进行。
我在 Kindle 上阅读 PDF 时遇到问题,因为 OCR 文本每页显示为两列。(IE 这本书一次被扫描两页,它们是 OCR 的。)我怎样才能将它格式化为一列(或任何样式),以便我可以在我的 Kindle 上阅读它?