印在金属板上的文字上的OCR

Question

我正在进行一个OCR项目，该项目的目的是从金属板上读取压印的序列号：

标记文本示例。

我正在使用OpenCV为OCR准备图像，并为TCR本身使用Tesseract。这是理想的过程：

我当前的流程是这样的：

但是，我取得的成功非常有限。我的主要问题是：

Answer 1

我觉得这可能不是完整的解决方案，但可以提供帮助 -

我一直在研究类似的场景，我想从浮雕金属中提取文本。

我的方法和你的方法类似 -

我注意到，当文本颜色为黑色且背景为白色时，Tesseract 效果更好。（所以，我正在执行第七步）

我还想提一下，这完全取决于精明和你的形象。您可以将阈值保持较低以找到更多边缘，将阈值保持较高以找到更少边缘。但是更多的边缘会在图像中引入噪声，而更少的边缘将无法检测到整个数字。所以这一切都取决于精明的阈值和你的图像。