syd*_*ydd 7 c++ air ocr tesseract
我正在制作一个AIR项目,它需要一些OCR功能,所以我决定使用tesseract(现在我试着让它在Windows上工作).
我的问题是,它无法改变语言文件的位置 - 它总是试图查看我的Tesseract安装目录(程序文件(x86)\ Tesseract-OCR\tessdata\mylang.traineddata)
有没有办法可以配置Tesseract来查找我指定的文件?例如,与tesseract.exe在同一文件夹中.我不希望(或者可能是事件不能)使用AIR安装程序安装应用程序.我已经尝试过3.0版本和最新的SVN版本.
谢谢
ngu*_*enq 11
是的,您可以通过设置TESSDATA_PREFIX环境变量,例如:
export TESSDATA_PREFIX =/usr/local/share /
请注意,目录路径必须以/结尾.
我通过重写 Tesseract 的源代码解决了这个问题(我使用的是 SVN 597)。正如 nguyenq 所说,Tesseract 尝试在 TESSDATA_PREFIX 环境变量设置的路径中查找数据。如果没有找到,那么它会做一些我不明白的诡计:)。因此,如果有人需要 Tesseract 的便携式版本(不依赖于 Tesseract 安装),请编辑 mainblk.cpp 第 60 行左右,这是我的版本:
// remove the stuff that Tesseract does to find the installation path
/* if (!getenv("TESSDATA_PREFIX")) {
#ifdef TESSDATA_PREFIX
#define _STR(a) #a
#define _XSTR(a) _STR(a)
datadir = _XSTR(TESSDATA_PREFIX);
#undef _XSTR
#undef _STR
#else
if (argv0 != NULL) {
if (getpath(argv0, dll_module_name, datadir) < 0)
#ifdef __UNIX__
CANTOPENFILE.error("main", ABORT, "%s to get path", argv0);
#else
NO_PATH.error("main", DBG, NULL);
#endif
} else {
datadir = "./";
}
#endif
} else {
datadir = getenv("TESSDATA_PREFIX");
}*/
datadir = "./"; // look for config things in the same folder as the executable.
Run Code Online (Sandbox Code Playgroud)
现在你可以将东西打包到“tesseract可执行位置”\tessdata目录中
| 归档时间: |
|
| 查看次数: |
17066 次 |
| 最近记录: |