小编Har*_*ave的帖子

R中的Tesseract无法识别"&"

我是R编程的初学者,应该编写一个代码来读取图像中的文本!我正在使用Tesseract和Magick包来做同样的事情并面临一个代码将"&"转换为"8:"的问题我附加了我用作输入的图像.用于处理的图像

下面是我正在运行的代码

test2 <- image_read("C:/Users/admin/Desktop/testimage.jpg") %>%
  image_resize("2000") %>%
  image_convert(colorspace = 'gray') %>%
  image_trim() %>%
  image_ocr()
cat(test2)
write.table(test2, "C:/Users/admin/Desktop/output2.txt", sep="\t")
Run Code Online (Sandbox Code Playgroud)

以下是我得到的输出

No relation between boycotting
panchayat polls 8: Article 35A:
Subramanian Swamy
Run Code Online (Sandbox Code Playgroud)

我已经提到了以下来源以获得一些理解,但没有找到任何适合此特定问题的解决方案.

我也浏览了这个网站,但在阅读特殊字符方面没有太多帮助.

如果有人可以帮助我,那将非常有帮助.

ocr tesseract r imagemagick

6
推荐指数
1
解决办法
186
查看次数

标签 统计

imagemagick ×1

ocr ×1

r ×1

tesseract ×1