fra*_*isk 1 java tesseract tess4j
我正在使用Web服务来读取图像文件并使用Tesseract在其上返回一些文本.
我们知道Tesseract/Tess4j支持ISO 639-3格式的语言输入(即:eng,spa,deu,ara等等),但我从移动设备获得的语言有以下格式:en-gb,pt-br,...
我的用户可以使用任何语言并请求图片阅读.
我的问题是:任何人都有任何想法如何解决这个问题?
而且,如果我没有设置任何语言,它是否猜测/找到图像上的语言?
我的问题是:任何人都有任何想法如何解决这个问题?
使用类似的东西转换/找到正确的语言
for (Locale locale : Locale.getAvailableLocales()) {
System.out.println("" + locale
+ "; display: " + locale.getDisplayLanguage()
+ "; name: " + locale.getDisplayName()
+ "; lang: " + locale.getLanguage()
+ "; iso3: " + locale.getISO3Language());
}
Run Code Online (Sandbox Code Playgroud)
然后你可以在tess4j中设置它.
而且,如果我没有设置任何语言,它是否猜测/找到图像上的语言?
我认为应该设置默认值,否则会引发错误.(没有经过源代码)
| 归档时间: |
|
| 查看次数: |
259 次 |
| 最近记录: |