lov*_*eed 323 command-line pdf conversion jpeg
我在一个目录中有许多 JPEG 文件,我想将它们转换为 PDF 并将它们连接在一起以形成一个文档。
如何才能做到这一点?
我更喜欢使用命令行,因为这个过程会更快。
ros*_*sch 432
从imagemagick包中,使用convert命令:
convert *.jpg -auto-orient pictures.pdf
Run Code Online (Sandbox Code Playgroud)
您将获得一个包含当前文件夹中所有 jpg 的 pdf。该选项-auto-orient读取图像的 EXIF 数据以旋转图像。
安装 IM:
sudo apt-get install imagemagick
Run Code Online (Sandbox Code Playgroud)
来源:stackoverflow imagemagick 选项
编辑:请注意,如果图像没有编号,它们将不按特定顺序排列。如果您有 10 个或更多,您需要将它们命名为 filename01.jpg...filename99.jpg 等。正确排序需要前导零。如果您有 100 个或更多 001...999。
Edu*_*scu 85
不幸的是,convert在“打包”到 PDF 之前改变了图像质量。因此,有质量的损失最小,不如把原来的jpg,(作品有.png太)到PDF,您需要使用img2pdf。
我使用这些命令:
更短的单衬解决方案也img2pdf按照评论中的建议使用**
制作PDF
img2pdf *.jp* --output combined.pdf
(可选)OCR 输出 PDF
ocrmypdf combined.pdf combined_ocr.pdf
以下是需要更多命令和更多工具的原始答案命令:
此命令是在不损失分辨率或质量的情况下pdf从每个jpg图像中制作一个文件:
ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
此命令会将pdf页面连接到一个文档中:
pdftk *.pdf cat output combined.pdf
最后,我添加了一个 OCRed 文本层,它不会改变 pdf 中的扫描质量,以便它们可以被搜索:
pypdfocr combined.pdf
使用的替代方法pypdfocr:
`ocrmypdf combined.pdf combined_ocr.pdf`
Run Code Online (Sandbox Code Playgroud)
小智 37
convert `ls -1v` file.pdf
Run Code Online (Sandbox Code Playgroud)
gao*_*the 22
为我工作(但警告!关闭压缩,生成的 PDF 会很大!):
convert page1.jpg page2.jpg +compress file.pdf
Run Code Online (Sandbox Code Playgroud)
甚至:
convert -rotate 90 page\*.jpg +compress file.pdf
Run Code Online (Sandbox Code Playgroud)
从 ubuntuforums.org+compress可以帮助它不挂起。注意:+compress 关闭压缩。我当时正在使用的机器似乎挂了?永远?(虽然我没有等太久才发现。)没有 +compress 选项。您的里程可能会有很大差异!imagemagick.org 上的RTFM选项 -compress,如果您有缓慢的压缩/挂起问题,可以尝试使用 -compress < type> 以找出适合您的方法。
tob*_*ora 10
我很好奇没有人指出 pdfjam,这是将图像/pdf 合并为 pdf 的一种超级有效的方法:
pdfjam --a4paper *.jpg
Run Code Online (Sandbox Code Playgroud)
将为您创建所有.jpg文件的A4 格式的 pdf ,通常以 a-pdfjam.pdf结尾。要强制使用特定的输出名称,您可以--outfile <your output>选择!
据我所知,文件没有重新编码,与convert.
要安装 pdfjam,我不确定最有效的方法是什么(LaTeX 会自动提供),但您可以尝试:
sudo apt install pdfjam
Run Code Online (Sandbox Code Playgroud)
或者可能
sudo apt install texlive-extra-utils
Run Code Online (Sandbox Code Playgroud)
下面的解决方案也依赖于 ImageMagick 的,convert但有点复杂,因为:
pdfimages -j file.pdf img。)目前,这只适用于 PNG – 请参阅下面@dma_k 的评论.指示:
使用 PDFtk 连接所有单页 PDF 文件,如下所示:
pdftk *.pdf cat output out.pdf
Run Code Online (Sandbox Code Playgroud)| 归档时间: |
|
| 查看次数: |
356577 次 |
| 最近记录: |