小编Bar*_*raa的帖子

在Tesseract OCR中使用了什么阈值(二值化)算法?

我正在开发一个项目,需要准确的OCR结果,用于具有丰富背景的图像.所以我比较两个OCR(其中一个是Tesseract)的结果来做出我的选择.关键是结果受到预处理步骤的强烈影响,尤其是图像二值化.我提取了另一个OCR的二值化图像并将其传递给Tesseract,使Tesseract的结果增强了30-40%.

我有两个问题,你的答案对我有很大帮助:

  1. 什么二值化算法可以使用,它是否可配置?
  2. 有没有办法提取Tesseract OCR的二值化图像,以便我可以测试其他OCR?

提前致谢 :)

ocr tesseract adaptive-threshold

4
推荐指数
2
解决办法
4273
查看次数

将一个向量附加到另一个向量时,为什么移动元素比复制它们更便宜?

假设我有两个向量,src并且dst我想附加src到 的末尾dst

我注意到有关此任务的大多数答案都建议这样做:

     dst.insert(dst.end(),
                std::make_move_iterator(src.begin()),
                std::make_move_iterator(src.end()));
Run Code Online (Sandbox Code Playgroud)

对此:

    dst.insert(dst.end(), src.begin(), src.end());
Run Code Online (Sandbox Code Playgroud)

据我所知,将元素推入(插入)向量需要在两种情况下为向量末尾的插入元素分配空间,以确保内存连续性,并且我假设在这种情况下 和 成本copymove相同的。

移动物体将使它们立即被摧毁,这是这样做的唯一好处,还是我还缺少其他东西?

编辑: 您能解释一下在这两种情况下:

  1. 向量包含纯数据,例如:int。
  2. 向量包含类对象。

c++ vector

2
推荐指数
1
解决办法
439
查看次数

标签 统计

adaptive-threshold ×1

c++ ×1

ocr ×1

tesseract ×1

vector ×1