i'm using the tessnet2 wrapper to the Tesseract 2.04 Source on windows XP, configured it to work with x86.
TessarctTest project main function contains:
        Bitmap bmp = new Bitmap(@"C:\temp\New Folder\dotnet\eurotext.tif");
        tessnet2.Tesseract ocr = new tessnet2.Tesseract();
        // ocr.SetVariable("tessedit_char_whitelist", "0123456789");
        ocr.Init(@"C:\temp\tessdata", "eng", false);
        // List<tessnet2.Word> r1 = ocr.DoOCR(bmp, new Rectangle(792, 247, 130, 54));
        List<tessnet2.Word> r1 = ocr.DoOCR(bmp, Rectangle.Empty);
        int lc = tessnet2.Tesseract.LineCount(r1);
when i try to run the program it crashes on the following line inside the ocr.Init
int result = m_myTessBaseAPIInstance->InitWithLanguage((char …我希望使用EMGU.CV的Tesseract对象在一些图片上进行OCR.首先,我已经下载,编译并运行了他们的OCR和LicensePlateRecognition示例.
但是,Tesseract不断抛出以下异常:
无法使用Path'teseract'和语言'eng'创建ocr模型.
我追溯到源头:
_ocr = new Tesseract(@"tessdata", "eng", Tesseract.OcrEngineMode.OEM_TESSERACT_CUBE_COMBINED);
我尝试用最明显的方法修复它:我给它完整的路径,我将文件复制到'C:\',我确保我的程序的当前目录与tessdata相同.
这些都不起作用,所以我使用procmon并发现它在这里寻找文件:
C:\ Program Files(x86)\ Tesseract-OCR\tessdata
似乎无论我做什么,我都无法从这个位置改变它.(当然,移动那里的文件).这个位置在EMGU.cv的代码中不存在,所以我的猜测是它被编译成Tesseract的代码作为默认值(?).
那么,如何更改Tesseract使用此位置?显而易见的方法是,Tesseract构造函数应该使用我传递给它的路径做某事,所以我错过了什么?
我正在尝试使用 Tessnet2 在 C# 中使用 Tesseract 引擎。对于我给 Tessnet2 的许多测试图像,输出非常糟糕,几乎没有什么是正确的。
这是我在 C# 控制台项目 Program.cs 类中的代码:
 static void Main(string[] args)
    {
        try
        {
        Bitmap image = new Bitmap(@"C:\Users\hp\Desktop\eurotext.tif");
        var ocr = new Tesseract();
        //when I tried to add the SetVariable(...), it didn't change the output much
        ocr.Init(@"C:\Program Files (x86)\Tesseract-OCR", "eng", true);
        var result = ocr.DoOCR(image, Rectangle.Empty);
        foreach (Word word in result)
            Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
        Console.ReadLine();
    }
    catch (Exception exception)
    {
        Console.WriteLine("Error");
    }
}
例如,这是一个样本(大二进制 300 dpi)测试图像“eurotext.tif”:

这是该图像的 Tessnet2 输出:

我一直在使用这个网站来学习使用 …
我需要对.jpg图像进行OCR.我搜索了很多,最后得到了"tessnet2".代码看起来很简单,但我的例子有问题:l
当我尝试初始化ocr时,我的应用程序退出并且没有返回任何内容.Debuging,看起来像下一行是它退出的地方:
ocr.Init("C:\\Desarrollo\\Prueba\\ConsoleApplication1\\tessdata", "spa", false);
包含"tessdata"的路径的第一个参数,不是吗?第二条路是我想要使用的语言......
在tessdata中我有它需要的8个文件.
我做错了什么?
我正在使用c#和visual studio 2010.当我尝试编译它时,我得到.net框架的错误(我使用的是4.0,它需要2.0,我减少它,现在编译但我得到了这个问题).
谢谢!
我通过以下代码在C#中使用Tessnet2 ocr:
 tessnet2.Tesseract ocr = new tessnet2.Tesseract();
            ocr.SetVariable("tessedit_char_whitelist", "0123456789");
            ocr.Init(Application.StartupPath + @"D:\\Program Files (x86)\\Visual Studio 2010\\Projects\\AForgeTest2\\AForgeTest2\\tessdata\\", "eng", true);
            List<tessnet2.Word> result = ocr.DoOCR(numberTest, Rectangle.Empty);
            string code = result[0].Text;
            testBox1.Text = code;
但是当我运行调试时,它显示第5行中的错误消息:
 
static void Main()
        {
            Application.EnableVisualStyles();
            Application.SetCompatibleTextRenderingDefault(false);
            Application.Run(new Form1());//the line with error
        }
FileLoadException为Unhandle:
混合模式程序集是针对运行时的版本"v2.0.50727"构建的,如果没有其他配置信息,则无法在4.0运行时加载.
你知道如何解决这个问题吗?
亲切的问候
加夫