如何在python-tesseract中设置tessedit_write_images?

tia*_*lva 7 tesseract python-tesseract

我试图设置tessedit_write_images但似乎无法做到,我无法在任何地方看到tessinput.tif

我正在做:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_TESSERACT_ONLY)
api.SetPageSegMode(tesseract.PSM_AUTO_OSD)
api.SetVariable("tessedit_write_images", "T")
Run Code Online (Sandbox Code Playgroud)

但我尝试过"真实","1",以及更多变化,似乎根本不起作用.

有帮助吗?

小智 2

tessedit_write_images在 Tesseract 的源代码中仅检查一次(由TessBaseAPI::ProcessPage(),参见此处)。

所以你有两种方法:

  1. 调用api.GetThresholdedImage(),返回的图像就是设置变量并调用 时将保存的图像ProcessPage
  2. 只需调用api.ProcessPage(),它就会看到该变量并输出 tif。