我有大约1000个pdf文件,我需要将它们转换为300 dpi的tiff文件.做这个的最好方式是什么?如果存在可以编写脚本的SDK或其他工具或工具,那将是理想的.
我需要使用MS Reporting Services重构一些报告(使用Jasper生成).原始报告的副本以PDF格式提供.要求是使新报告"像素完美",这是非常麻烦的...
为了让生活更轻松,我希望有一个工具覆盖原始和生成的报告PDF,以测量它们是否完美.
有这样的工具吗?
是否有一种良好可靠的方法来比较相同格式和相同分辨率的图像并获得它们之间的差异?
在最好的情况下,我正在寻找可以进行比较的图像的数字表示,因为我必须比较许多图像.
可能重复:
比较大量PDF文件的工具?
我在经典场景的业务给你一堆新的新的一年的PDF表单没有修订说明任何和你应该弄清楚什么是从去年的不同.
我在这里谈论大量的表单,所以我试图找到一种方法来比较PDF以概述差异,而无需人们手动遍历每一个.
我的想法是从PDF中提取所有文本并将其转储到.txt然后在文本文件上运行差异,但这听起来很糟糕.
我的问题以编程方式说,但我对任何用于比较PDF的可靠工具感到满意,并且主要是希望从人们的经验中获得一个想法.也愿意接受任何程序化解决方案(最好是在C#中,但请发布任何想法).
我正在编写一个Ruby脚本/应用程序,可以帮助我将LaTeX编译为(至少)PDF。我希望它具有的功能之一是它应该pdflatex迭代运行,直到PDF收敛为止(我猜应该如此)。
这个想法是将一次迭代中生成的PDF与使用其指纹的前一次迭代中生成的PDF进行比较。特别是,我目前使用Digest::MD5.file(.)。
现在的问题是,这永远不会收敛。(希望的)罪魁祸首是PDF的时间戳,时间戳至少设置为秒pdflatex。由于运行时间pdflatex通常超过一秒钟,因此结果不断变化。也就是说,我希望在某个时间点之后,PDF的时间戳等于时间戳。这个假设可能是错误的。提示表示赞赏。
我该怎么办?到目前为止,我的基本想法是:
您有更多的想法,甚至解决方案吗?解决方案只能使用在Linux上运行的免费软件。这样,只使用Ruby是首选,但是完全可以使用外部软件。
顺便说一句,我不完全了解PDF的编码方式,但我怀疑仅比较包含的文本对我不起作用,因为在以后的迭代中仅图形或链接可能会更改。
可能相关:
我正在使用compare两个相似的颜色 PNG文件.他们的PSNR值为~27.
图像包含许多白色区域,这两个区域在两个图像之间始终匹配.如果我错了,请纠正我,但这些白色区域正在增加PSNR值(使图像与平均值更相似).因此,如果它们匹配,我不想考虑白色像素.
有没有办法使用compare或通过考虑其他工具来做到这一点?
我尝试设置-transparent-color为白色,但这没有效果.
这是我的命令:
compare -compose src -metric PSNR img1.png img2.png diff.png
Run Code Online (Sandbox Code Playgroud)
编辑:
compare --version
Version: ImageMagick 6.6.9-7 2014-03-06 Q16 http://www.imagemagick.org
convert --version
Version: ImageMagick 6.6.9-7 2014-03-06 Q16 http://www.imagemagick.org
Run Code Online (Sandbox Code Playgroud)
我忽略白色像素的想法可能是垃圾,但我仍然希望实现更好的比较.
澄清:
想象一下这种情况:你比较两个图像,它们有点不同.然后,为这些图像添加一个大的白色边框.你再次差异,发现结果PSNR值上升了一些.我想要的是一种否定这一点的方法.显然两个图像中的白色边框是相同的......