有没有办法让Tesseract只匹配用户指定的单词或模式?该手册声称它是可能的,但我无法在互联网上找到一个记录在案的实例.
以下是许多人寻求帮助的例子,因为它不起作用,而且没有一个人能得到证实.
stackoverflow.com/questions/33429143/tesseract-user-pattern-is-not-applied
stackoverflow.com/questions/31874393/tesseract-ocr-force-pattern
stackoverflow.com/questions/26856349/provide-pattern-for-tesseract
stackoverflow.com/questions/22432194/tesseract-ocr-only-detect-user-words
stackoverflow.com/questions/17209919/tesseract-user-patterns
groups.google.com/forum/#!topic/tesseract-ocr/S9CIK3jOMWw
groups.google.com/forum/#!topic/tesseract-ocr/5vFqVcJmHnM
那么我们可以得出结论,这个功能根本不起作用吗?这是否有官方声明?
现在在https://tesseract-ocr.github.io/tessdoc/APIExample-user_patterns.html的 Tesseract 文档站点上有一个示例[感谢 @Ravi 提供新链接]
该测试示例在 Tesseract 4.x 的 oem=1 / LSTM 模式下对我有用。
但是,我无法让它适用于任何其他示例或任何其他模式。
我没有看到任何官方声明,在撰写本文时,该功能似乎确实不起作用。