错误的tesseract截图识别结果

Mik*_* M 7 python windows ocr screen-scraping

我正在尝试PyTesseract识别从其他程序捕获的文本.结果出乎意料地糟糕.我认为这是一个简单的问题,因为扫描文件识别在20多年前相当不错.

例如我正进入(状态

"win32¢gui.EnumWindows(enum_cb, toplist)

winInfos = [(hwnd, title) for hwnd, title in winlist if
print("™sd process(es) found" % Len(winInfos))

wininfo = winInfos[@]

hwnd = wininfo[@]

# w2 = win32gui.Findwindow(None, “"Chrome")

for i in range(10):


eel eee"

Run Code Online (Sandbox Code Playgroud)

即使在没有缩放和不同背景和文本颜色的情况下也会变质.

我不需要完美的解决方案(这是相当实验性的项目),但至少需要足够的东西.我对如何实现/解决这个问题的方法不怎么限.仅限于Windows和Python也是非常理想的.我或多或少地认识Python,并且在整个编程方面经验丰富,但在文本识别方面却是新手.

Tesseract是我尝试过的第一个图书馆.我读到它是最好的之一.我已经知道它喜欢大字体(虽然对于截图来说,所有相同的符号总是看起来相同,我认为8像素的高度已经足够了).并看到缩放和使所有背景和文字颜色相等的帮助,但还不够.我将识别具有不同文本颜色和背景的表的内容,因此不希望偶然发现这些事情.

解决方法我看到:

增加源程序中的字体以获得"真正的"更高分辨率(不确定这将有多大帮助),
在我的字体上训练Tesseract(快速搜索显示这很无聊 - 有20个步骤的说明或我没有的Python脚本),
尝试其他图书馆.

你能推荐什么？

谢谢

归档时间：	7 年，2 月前
查看次数：	385 次
最近记录：	7 年，2 月前