在python中从屏幕中提取文本

Vil*_*elm 5 python screen

是否有用于从png位图屏幕截图中提取文本的库等?

它适用于自动化程序,并且(例如)能够读取按钮等。我已经检查过 Tesseract,但它似乎是为图片制作的,而不是计算机屏幕字体。

gon*_*opp 2

如果您正在处理少量可能的匹配(即:您想要识别两个或三个不同的按钮),最简单的方法是隔离上一个屏幕截图中的那些,将它们保存到单独的文件中,然后使用某种形式的模板匹配,这在 opencv 中非常容易

但是,如果您需要实际识别按钮文本,则需要 OCR 引擎。Tesseract 是一个很好的候选者,如果你可以让它针对你的字体进行训练(这是一个漫长的过程)。正如您提到的,如果您正在处理小字体,则需要执行此操作,而超立方体最初并未经过训练来识别该字体。如果你不能,Python 中还有其他一些可用的引擎,比如Ocropus