是否有用于从png位图屏幕截图中提取文本的库等?
它适用于自动化程序,并且(例如)能够读取按钮等。我已经检查过 Tesseract,但它似乎是为图片制作的,而不是计算机屏幕字体。
如果您正在处理少量可能的匹配(即:您想要识别两个或三个不同的按钮),最简单的方法是隔离上一个屏幕截图中的那些,将它们保存到单独的文件中,然后使用某种形式的模板匹配,这在 opencv 中非常容易。
但是,如果您需要实际识别按钮文本,则需要 OCR 引擎。Tesseract 是一个很好的候选者,如果你可以让它针对你的字体进行训练(这是一个漫长的过程)。正如您提到的,如果您正在处理小字体,则需要执行此操作,而超立方体最初并未经过训练来识别该字体。如果你不能,Python 中还有其他一些可用的引擎,比如Ocropus
| 归档时间: |
|
| 查看次数: |
17934 次 |
| 最近记录: |