Bar*_*raa 4 ocr tesseract adaptive-threshold
我正在开发一个项目,需要准确的OCR结果,用于具有丰富背景的图像.所以我比较两个OCR(其中一个是Tesseract)的结果来做出我的选择.关键是结果受到预处理步骤的强烈影响,尤其是图像二值化.我提取了另一个OCR的二值化图像并将其传递给Tesseract,使Tesseract的结果增强了30-40%.
我有两个问题,你的答案对我有很大帮助:
提前致谢 :)
我想我找到了问题的答案:
1-使用的二值化算法是Otsu阈值处理.你可以看到它在这里管线179中.
2-要获得二值化图像,可以调用tesseract api中的方法:
PIX* thresholded = api->GetThresholdedImage(); //thresholded must be freed
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
4273 次 |
最近记录: |