如何使用移动设备中的语言在Tess4J中设置语言?

fra*_*isk 1 java tesseract tess4j

我正在使用Web服务来读取图像文件并使用Tesseract在其上返回一些文本.

我们知道Tesseract/Tess4j支持ISO 639-3格式的语言输入(即:eng,spa,deu,ara等等),但我从移动设备获得的语言有以下格式:en-gb,pt-br,...

我的用户可以使用任何语言并请求图片阅读.

我的问题是:任何人都有任何想法如何解决这个问题?

而且,如果我没有设置任何语言,它是否猜测/找到图像上的语言?

Tin*_*son 5

我的问题是:任何人都有任何想法如何解决这个问题?

使用类似的东西转换/找到正确的语言

    for (Locale locale : Locale.getAvailableLocales()) {
        System.out.println("" + locale
                + "; display: " + locale.getDisplayLanguage()
                + "; name: " + locale.getDisplayName()
                + "; lang: " + locale.getLanguage()
                + "; iso3: " + locale.getISO3Language());
    }
Run Code Online (Sandbox Code Playgroud)

然后你可以在tess4j中设置它.

参考以上内容

而且,如果我没有设置任何语言,它是否猜测/找到图像上的语言?

我认为应该设置默认值,否则会引发错误.(没有经过源代码)