标签: ocr

Pytesseract（Tesseract OCR）无法获取一些数字

我一直在开发一个使用光学字符识别来读取财务报表的程序，我一生都无法弄清楚为什么我正在使用的开源模块仍然无法读取某些数字。

我创建了一个输出文件，在原始输入周围带有绿色框，其中正在检测文本。在这种情况下，带有“381”的行被选取，但下面的行（具有相同的精确格式）被忽略。

我在提取数据之前使用此代码对图像进行预处理，因为之前的丢失率高达 20%，现在接近 5%。

img = cv2.imread(filename)
img = cv2.resize(img, None, fx=1.2, fy=1.2, interpolation=cv2.INTER_CUBIC)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
kernel = np.ones((1, 1), np.uint8)
img = cv2.dilate(img, kernel, iterations=1)
img = cv2.erode(img, kernel, iterations=1)

Run Code Online (Sandbox Code Playgroud)

在此预处理之后，我还运行了一种算法，从文档中删除超过一定大小的实线，但在这种情况下，“35”或“381”在原始文件中都没有下划线，所以我怀疑这是导致问题的原因。我还验证了 5 的顶部部分没有被线条检测算法删除。

我不是 OCR 或 CV 方面的专家，我的专长是更多数据和通用编程——我真的只需要让这个库完成它所宣传的工作，这样我就可以继续并完成程序。有谁知道可能导致此问题的原因是什么？

python ocr opencv computer-vision python-tesseract

S42*_*20L

2022 07-16

1
推荐指数

1
解决办法

1401
查看次数

在图像中搜索指定的文本

我想我会在这里问非常愚蠢的问题.在我目前的项目中,我想提供搜索功能.我有一个很大的图像教程,里面有很多关于主题的信息,我想在图像中搜索特征.假设使用类似"Apple"的类型,它将显示Apple在图像中出现了多少次,并在点击图像后滚动并转到发生"Apple"的位置.

感谢您阅读我的愚蠢问题,但如果有可能请让我知道并提供一些示例代码？

iphone ocr image-processing

use*_*445

2010 12-28

0
推荐指数

1
解决办法

5328
查看次数

有没有办法为iOS教授tesseract一种新字体？

我目前使用诺兰布朗的例子在iOS上使用tesseract .它工作正常,但我需要它开始拾取一个新的字体(我有.tff格式),这将永远是数字.

我在StackOverflow上发现了关于tesseract学习字体的问题,这些字体都指向谷歌指南,介绍如何使用命令行教授Tesseract新字体.但是我已经在使用Nolan的lib的编译副本了.

我如何教tesseract一个新的字体？我需要重新编译iOS的lib吗？我该怎么做呢？

我是OCR和tesseract lib的新手,所以请光临我.

ocr fonts tesseract ios

作者

2019 04-09

0
推荐指数

1
解决办法

1522
查看次数

如何使用OpenCV从名片中删除非文本区域？

我的目标是从扫描的名片图像中删除任何非文本区域,但我不知道使用OpenCV执行该操作的步骤,我已按照这些步骤但不知道这是正确的,或者我也不知道注意图像中的任何变化(非文本区域仍然存在)任何想法将非常有用,谢谢.

1)将图像转换为灰度

2)二进制图像

3)反转颜色(cv :: bitwise_not)以获得白色像素文本

4)侵蚀图像(cv :: erode)

5)使用canny检测边缘

6)使用霍夫变换检测文本行(尚未)

码:

cv::Mat greyMat = [self.imageView.image CVGrayscaleMat];
cv::Mat bwMat;
cv::threshold(greyMat, bwMat, 128, 255, CV_THRESH_BINARY);
cv::bitwise_not(bwMat, bwMat);
cv::Mat element = cv::getStructuringElement(cv::MORPH_RECT, cv::Size(2, 1));
cv::erode(bwMat, bwMat, element);
std::vector<cv::Point>points;
cv::Mat_<uchar>::iterator it=bwMat.begin<uchar>();
cv::Mat_<uchar>::iterator end=bwMat.end<uchar>();
for (; it!=end; ++it) 
if (*it) 
points.push_back(it.pos());
cv::RotatedRect box=cv::minAreaRect(cv::Mat(points));
plImage* smothedImage=new IplImage(bwMat); 
cvSmooth(smothedImage, smothedImage);
cvCanny(smothedImage, smothedImage, 10, 100);

Run Code Online (Sandbox Code Playgroud)

c++ ocr opencv image-processing image-segmentation

cho*_*vil

2013 01-15

0
推荐指数

1
解决办法

5712
查看次数

需要使用opencv制作ocr的步骤

我正在尝试使用opencv的Haar分类器创建一个OCR库.但它不能正常工作.所以你能告诉我制作OCR的步骤是什么吗？是否可以使用Haar分类器？

c++ ocr opencv

use*_*108

lucky-day

0
推荐指数

1
解决办法

4491
查看次数

如何使用tesseract和opencv从相机中提取文本

我正在使用tesseract 3.02和opencv让tesseract实时识别我的相机中的文字.

但效果非常糟糕.结果不可读,无法流畅地显示图像.我认为这是我的代码问题.

有人可以给我一些关于如何修改它的建议吗？

非常感谢!

#include "stdafx.h"
#include <string>
#include <opencv2/opencv.hpp>
#include <time.h>


using namespace std;
using namespace cv;


int main() {

    // [1]
    tesseract::TessBaseAPI *myOCR = 
            new tesseract::TessBaseAPI();

    // [2]
    printf("Tesseract-ocr version: %s\n",
           myOCR->Version());
    printf("Leptonica version: %s\n",
           getLeptonicaVersion());

    // [3]
    if (myOCR->Init(NULL, "eng")) {
      fprintf(stderr, "Could not initialize tesseract.\n");
      exit(1);
    }

    //??IplImage??
    IplImage* pFrame = NULL;

    //?????
    CvCapture* pCapture = cvCreateCameraCapture(-1);

    //????
    cvNamedWindow("video", 1);

    //????
            time_t last_time = time(NULL);
    while(1)
    {

        pFrame=cvQueryFrame( pCapture );
        if(!pFrame)    break;
        cvShowImage("video",pFrame);
        char c=cvWaitKey(33); …

Run Code Online (Sandbox Code Playgroud)

ocr opencv tesseract

use*_*046

2013 01-03

0
推荐指数

1
解决办法

6138
查看次数