如何表示:
为什么?
小智 18
您必须将"页面分段模式"设置为"单个字符".
例如,在Android中,您执行以下操作:
api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);
Run Code Online (Sandbox Code Playgroud)
您需要将Tesseract的页面分段模式设置为"单个字符".
执行该配置的python代码如下:
import pytesseract
import cv2
img = cv2.imread("path to some image")
pytesseract.image_to_string(
img, config=("-c tessedit"
"_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"
" --psm 10"
" -l osd"
" "))
Run Code Online (Sandbox Code Playgroud)
该--psm标志定义了页面分段模式。
根据tesseract的documentaion,10意思是:
将图像视为单个字符。
所以要识别单个字符,您只需要使用 :--psm 10标志。
你见过这个吗?
https://code.google.com/p/tesseract-ocr/issues/detail?id=581
错误列表将其显示为"不再是问题".
baseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");之前的代码init Tesseract| 归档时间: |
|
| 查看次数: |
19175 次 |
| 最近记录: |