有谁知道C/C++/Objective-C中的任何免费/开源文本识别库?基本上可以扫描图像,并读出所有纯文本.
我目前正在编写应该能够查看文本图片的代码,然后从基于Android的设备的图片中提取文本.我在网上做了一些研究,发现谷歌提供了自己的API,名为"Mobile Vision"(一个包含很多项目的软件包,包括文本识别,面部识别等).然而,在他们的演示中,他们只展示实时文本识别.我想知道是否有人可以使用Mobile Vision API给我一个静止图像上的文本识别示例.欢迎任何帮助.谢谢.
我一直在尝试使用Python实现一个OCR程序,该程序读取具有特定格式的数字,XXX-XXX.我使用了Google的Cloud Vision API文本识别功能,但结果并不可靠.在30个高对比度1280 x 1024 bmp图像中,只有少数产生正确的输出,或者至少在结果中包含正确的输出.该程序倾向于省略一些数字,以非英语语言输出或隐藏一些特殊字符.
目标是至少连续输出正确的数字,如果结果与其他垃圾混在一起无关紧要.有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字?
python ocr text-recognition google-cloud-platform google-cloud-vision
我正在研究 OCR 系统。我在识别ROI内的文本时面临的一个挑战是抖动或运动效果镜头或由于角度位置而无法聚焦的文本。请考虑以下演示示例
如果您注意到文本(例如标记为红色),在这种情况下 OCR 系统无法正确识别文本。但是,这种情况也可能在没有角度拍摄的情况下出现,其中图像太模糊以至于 OCR 系统无法识别或部分识别文本。有时它们很模糊,有时分辨率很低或像素化。例如
首先,我们尝试了 SO 上可用的各种方法。但遗憾的是没有运气。
接下来,我们尝试了以下三种最有前途的方法。
1.TSRN
最近的一项研究工作(TSRN)主要关注此类案例。它的主要直觉是引入超分辨率(SR)技术作为预处理。到目前为止,这种实现看起来是最有前途的。但是,它无法在我们的自定义数据集上发挥作用(例如上面的第二张图片,蓝色文本)。以下是他们演示中的一些示例:
2. 神经增强
在查看其页面上的插图后,我们相信它可能会起作用。但遗憾的是它也无法解决这个问题。然而,即使是他们展示的例子,我也有点困惑,因为我也无法复制它们。我在 github上提出了一个问题,在那里我更详细地演示了这一点。以下是他们演示中的一些示例:
3. 情监侦
此实现中希望最小的最后选择。也没有运气。
[方法]:除此之外,我们还尝试了一些传统的方法,例如Out-of-focus Deblur Filter(Wiener 滤波器和无监督的Weiner 滤波器)。我们还检查了Richardson-Lucy方法。但这种方法也没有改进。
[方法]:我们已经检查了基于 GAN 的 DeBlur 解决方案。DeblurGAN我试过这个网络。吸引我的是Blind Motion Deblurring机制的方法。
最后,从这次 …
python ocr opencv text-recognition generative-adversarial-network
我有一个项目,它使用Google Vision API DOCUMENT_TEXT_DETECTION来从文档图像中提取文本.
通常,API在识别单个数字时会遇到麻烦,如下图所示:
我想这个问题可能与某些噪声消除算法有关,它将孤立的单个数字识别为噪声.有没有办法在这些情况下改善视力反应?(例如管理噪声阈值或其他参数)
在其他时候,Vision会将数字与字母混淆:
但如果我指定为参数languageHints ='en'或'mt',则ocr会忽略这些数字.有没有办法强制识别数字或拉丁字符?
ocr text-recognition google-cloud-platform google-cloud-vision
请看下面的截图,看看你能不能告诉我为什么这不起作用.TextRecognize参考页面上的示例看起来非常令人印象深刻,我不认为识别这样的单个字母应该是一个问题.我已经尝试调整字母大小以及使图像变得尖锐.
为了方便您自己尝试这个,我已经在这篇文章的底部包含了我使用的图像.您还可以通过在Google图片搜索中搜索"Wordfeud"来找到更多这样的内容.


目前我正在使用一个名为"Yolov2"的深度学习模型用于对象检测,我想用它来提取文本并使用将其保存在磁盘中,但我不知道该怎么做,如果有人知道更多关于那,请告诉我
我使用Tensorflow
谢谢
我已成功将tesseract集成到我的Android应用程序中,它会读取我捕获的任何图像,但准确度却非常低.但大部分时间我都没有在捕获后获得正确的文本,因为感兴趣区域周围的一些文本也被捕获.
所有我想要阅读的都是来自矩形区域的所有文本,准确无需捕获矩形的边缘.我做了一些研究并在stackoverflow上发布了这两次,但仍然没有得到满意的结果!
以下是我发的2篇帖子:
/sf/ask/1166445311/?noredirect=1#comment23973954_16663504
我不确定是继续使用tesseract还是使用openCV
我是iOS开发的新手,我正在尝试创建一个应用程序,使用iPhone的相机识别一串数字并将其转换为文本.
是否有可以轻松整合到我的应用程序中的iOS开发模块?或者是否有一个通用模块,我可以尝试移植iOS?
当然,免费模块更好.
提前致谢 :)
编辑:要删除暂停主持人提出这个问题,我已经提出以下要求:
iphone image-processing image-recognition text-recognition ios
我正在尝试将Google Mobile Vision TextRecogniser API实施到我的应用中,以便从给定的图像中读取文本.当我尝试使用该功能时,我收到此错误:
W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite not found.
I/DynamiteModule: Considering local module com.google.android.gms.vision.dynamite:0 and remote module com.google.android.gms.vision.dynamite:801
I/DynamiteModule: Selected remote version of com.google.android.gms.vision.dynamite, version >= 801
W/System: ClassLoader referenced unknown path: /data/user_de/0/com.google.android.gms/app_chimera/m/00000005/n/arm64-v8a
D/ApplicationLoaders: ignored Vulkan layer search path /data/app/com.google.android.gms-1/lib/arm64:/system/fake-libs64:/data/app/com.google.android.gms-1/base.apk!/lib/arm64-v8a for namespace 0x7a2e8c60f0
I/Vision: Loading libocr library
I/Vision: libocr load status: false
I/TextRecognizerCreatorImpl: Requesting download for native text recognizer
W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle.
Run Code Online (Sandbox Code Playgroud)
我相信,这意味着图书馆没有下载到手机上.
我已针对常见错误来源进行了问题排查,包括缺少互联网连接,内存不足,缺少依赖关系,重新启动手机,更新Google Play服务,等待一段时间等等.Google存储库和Play服务也在Android工作室中更新.
然而,即使在不同的设备上尝试我的应用程序,我仍然会得到相同的错误.
text-recognition ×10
ocr ×4
android ×3
opencv ×2
python ×2
c ×1
c++ ×1
generative-adversarial-network ×1
ios ×1
iphone ×1
objective-c ×1
tensorflow ×1
tesseract ×1