标签: ocr

如何从 .png 文件中提取 Unicode 字符?

我想从 .jpg 和 .png 文件中提取 Unicode 字符。

我尝试使用以下命令来做到这一点:

tesseract 1.png output.txt
Run Code Online (Sandbox Code Playgroud)

该命令适用于英文字符,但是当我尝试将它用于 Unicode(如印地语、马拉地语或梵文脚本)时,它会产生错误的输出。

是否有任何选项可以使用 OCR 将 Unicode(梵文)脚本提取到文本文件中?

ocr tesseract-ocr

3
推荐指数
1
解决办法
1544
查看次数

扫描 A4 文档 > pdf > ocr > 翻译成英文?

我试过使用组合

  • 我的家用扫描仪创建“300 dpi”、“文档”、“pdf”(佳能多合一选项)
  • ZoHoViewer 创建 RTF 或 TXT 文件
  • 谷歌文档翻译

我不确定 ZoHoViewer 产品的好坏,但以下几点:

Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von

变成:

AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag,dieVermittelbarkeit vonSt...

因此,goog docs 使尝试翻译它成为猪的早餐。

有没有人有更好的建议(最好是免费的在线服务)

pdf language translation scanning ocr

2
推荐指数
1
解决办法
3591
查看次数

自动阅读乐透号码

当我们购买大量乐透彩票时,有没有办法将所有这些数字读入电子表格,以便可以通过公式/宏与中奖号码进行核对?

我正在寻找一个 OCR 应用程序,它可以读取扫描的 PDF/JPG 文件并将它们转储到一个文件中。(这可能不仅适用于乐透,也适用于其他扫描文件。)至于检查中奖号码,一旦我将它们保存在 CSV/XLS 文件中,我就知道如何进行。

ocr spreadsheet

1
推荐指数
1
解决办法
1493
查看次数

如何将两列 OCR PDF 格式化为一列

我在 Kindle 上阅读 PDF 时遇到问题,因为 OCR 文本每页显示为两列。(IE 这本书一次被扫描两页,它们是 OCR 的。)我怎样才能将它格式化为一列(或任何样式),以便我可以在我的 Kindle 上阅读它?

pdf kindle ocr

1
推荐指数
1
解决办法
4164
查看次数