Tesseract 3中词典的优势

Wil*_*pes 10 ocr tesseract

如何在tesseract 3中增加/减少字典的强度?

它在FAQ中说我需要更改"NON_WERD"和"GARBAGE_STRING"的值,但它们在Tesseract 3中不存在.

roo*_*ell 4

根据 http://code.google.com/p/tesseract-ocr/wiki/FAQ,您更改这些变量:

enable_new_segsearch    1
language_model_penalty_non_freq_dict_word 0.2
language_model_penalty_non_dict_word 0.3
Run Code Online (Sandbox Code Playgroud)

增加它们的值,使 Tesseract 更偏向于字典单词。

注意:必须设置enable_new_segsearch,否则无效