该项目的最终目标是获取 jar 并将其放入使用 tesseract 的目录中,并输出结果目录和输出 txt 文件。不过,我在使用超正方体时遇到了一些问题。我正在 Java 中使用 tess4j 和 Maven,我想将我的代码放入可执行 jar 中。该项目作为桌面应用程序运行良好,但每当我尝试使用java -jar fileName.jar(导出到 jar 后)运行时,它都会给我错误
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory
Failed loading language 'eng'
...
Run Code Online (Sandbox Code Playgroud)
我在网上查找,但无法真正找到如何为 jar 设置超正方体并获得正确的路径。现在我使用 maven 并在我的 pom 文件(tess4j -v 3.0)中有 Tesseract 依赖项,并且我的项目中有 tessdata。
我对 Maven 和 jar 文件相当陌生,以前从未使用过 tesseract,但据我从互联网上可以看出,我设置正确。
有谁知道如何使 tess4j 指向我项目中的 tessdata 目录并拥有动态路径,以便我可以在多台计算机和位置上移动使用它?
这就是我所说的 Tesseract
Tesseract instance = new Tesseract();
instance.setDatapath("src/main/resources");
String result = instance.doOCR(imageFile);
String fileName = …Run Code Online (Sandbox Code Playgroud) 所以我正在使用 Commons UrlValidator (org.apache.commons.validator.routines.UrlValidator),我想知道是否有一种方法可以自定义它允许的域。现在似乎只允许 TLD,但我希望有一两个有效的名称不在该列表中,例如“.corp”(列表可在此处找到:http://data.iana.org/TLD/tlds-alpha -by-domain.txt)。是否有一种设置或解决方法,以便我不必创建自己的 url 验证器,并且可以将其与添加的域一起使用?