Bhu*_*han 6 ocr tesseract tess4j
我想在这张图片上做OCR.
这是预定义的格式.即前五个将是字符,然后接下来的四个将是数字,最后一个将是字符.
当我执行以下命令
$ tesseract in.png stdout
Run Code Online (Sandbox Code Playgroud)
我输出为BDVPD474SQ
所以,我去了用户模式.我创建了一个名为bazaar的文件(在目录/ usr/share/tesseract-ocr/tessdata/configs中)(其内容如下)
load_system_dawg F
load_freq_dawg F
user_patterns_suffix user-patterns
Run Code Online (Sandbox Code Playgroud)
我还在目录/ usr/share/tesseract-ocr/tessdata中创建了一个名为eng.user-patterns的文件(其内容如下)
\A\A\A\A\A\d\d\d\d\A
Run Code Online (Sandbox Code Playgroud)
不过,我得到了同样的结果
$ tesseract in.png stdout bazaar
BDVPD474SQ
Run Code Online (Sandbox Code Playgroud)
我做错了什么?Tess4j有没有人完成这个?
| 归档时间: |
|
| 查看次数: |
1568 次 |
| 最近记录: |