如何从PDF中删除蒙版或损坏的图像？

sam*_*sam 5 ubuntu ruby-on-rails poppler

我正在开发Ruby on Rails应用程序,以从PDF文件中提取文本和图像.在提取图像时,其中很少会被破坏.

提取后有没有办法识别那些损坏的图像？有谁知道他们为什么会被腐化？

我正在使用pdftohtml和pdftotext(poppler)Ubuntu实用程序.

提前致谢.

归档时间：	9 年，3 月前
查看次数：	108 次
最近记录：	9 年，3 月前

在Ubuntu上安装OpenCV for Python,得到ImportError:没有名为cv2.cv的模块 87

Ruby on Rails:向现有数据库添加列 19

Rails 3.1资产管道 - 为什么我的图像不能预编译用于生产？ 13

无法通过Homebrew启动elasticsearch服务器 13

Rails:已删除syck,而是使用psych 12

java.net.SocketException:无法分配内存(不是Mac) 8

如何在Ubuntu命令行的后台启动Firefox中的URL？ 7

Doxygen：找不到共享库“libclang.so.6” 5

在ubuntu上安装Yeoman时出错 4

为什么 Ubuntu 18.04 使用 `/sbin/init` 而不是 `systemd`？ 2

如何修改现有的,未删除的提交？ 7669

如何从异步调用返回响应？ 5208

Python中追加与扩展列表方法的区别 3119

从Git存储库中删除文件而不从本地文件系统中删除它 2892

迭代对象属性 1904

Python join:为什么是string.join(list)而不是list.join(string)？ 1669

单击div到底层元素 1500

如何撤消"git commit --amend"而不是"git commit" 1198

如何在不使用存储库的情况下将Docker镜像从一个主机复制到另一个主机 1181

如何使用SSH在远程计算机上运行shell脚本？ 1164