标签: pdf

删除 pdf 中的重复页面

我有一份 pdf 文档,总共 900 页,其中有 200 多个重复页面。当存在重复项时,它会立即出现在原始项之后。

也许pdftk可以完成这项工作,但我需要某种方法来找出重复项......

pdf pdftk

4
推荐指数
1
解决办法
626
查看次数

搜索超过100页的PDF文件并将其移动到UNIX/LINUX终端的目录中

我正在尝试搜索超过 100 页的 PDF 文件,然后将它们移动到 UNIX/LINUX 终端中的特定目录中。有点像这样:

find . -name '*.pdf' -pagenumber>100 -exec mv -t ~/directory
Run Code Online (Sandbox Code Playgroud)

显然-pagenumber>100这不是正确的命令。有专门的命令吗?

linux terminal find search pdf

4
推荐指数
2
解决办法
945
查看次数

可以提取pdf文件中每页的标题和pagenum

我想知道是否有一些方法可以提取pdf文件中每页的标题和页码?是通过某些应用程序,还是通过使用某些 pdf 库以某种编程语言进行编程?

每个页面的标题应该是页面的第一行,例如,在幻灯片/演示文件中。

输出应该是一个文本文件,格式如下:

title_of_first_page pagenum_of_first_page
title_of_second_page pagenum_of_second_page
...
Run Code Online (Sandbox Code Playgroud)

pdf text-processing

3
推荐指数
1
解决办法
1466
查看次数

寻找一种有效的方式来显示 PDF

我使用了几种 unix 工具来显示 PDF,例如xpdf, evince, epdfview...

我要找的东西不是很复杂。我想在应用程序窗口内显示一个完整的页面,并减少边距(没有边距或边距很小),并且只需按一个按钮就可以转到下一页/上一页

我不知道任何可以配置为执行此操作的 PDF 查看器。有谁知道怎么做?

software-rec configuration pdf

3
推荐指数
1
解决办法
201
查看次数

在 PDF 中按字母顺序连接多个 odt 文件的第一页

我在同一个目录中有几个 odt 文件。

我想在一个 PDF 文档中包含这些 odt 文件的第一页,并根据它们的文件名按字母顺序排序。

例如,如果我有这些文件:

  • a.odt
  • b.odt
  • c.odt

我想有一个生成的PDF有3页:中的第一个a.odt,那么第一个b.odt,然后中的第一个c.pdf

你们中有人考虑过这样做的命令吗?

command-line pdf

3
推荐指数
1
解决办法
821
查看次数

交换 pdf 文件中的奇数页和偶数页?

是否可以交换pdf文件中的奇数页和偶数页,例如第1页和第2页交换,第3页和第4页交换,...​​,假设pdf文件有偶数页?

可以使用某些软件(例如 pdftk 或 LaTeX)来完成吗?

pdf

3
推荐指数
1
解决办法
1105
查看次数

无需卸载即可恢复刚刚删除的扫描pdf

我刚刚删除了一个扫描的 pdf 文件。

我正在尝试使用scalpel.

问题是手术刀会恢复许多已删除的文件并用数字命名它们(例如 0001.pdf、0002.pdf、... 9999.pdf)。

根据本教程,我可以使用grep命令并在已删除的文件中搜索一些文本。

问题是,文件被扫描了(我知道原始文件名),所以我不知道要搜索什么。

data-recovery pdf

3
推荐指数
1
解决办法
304
查看次数

使用 Ghostscript 在 PDF 文件周围添加黑色边框

我正在使用 Ghostscript 处理一些 PDF 文件,我想在文件周围添加细黑色边框。这是可以用 Ghostscript 完成的事情,还是有其他(非有损)命令行工具可以做到这一点?

command-line pdf ghostscript

3
推荐指数
1
解决办法
2248
查看次数

Zathura 可以显示其他 pdf 程序生成的 pdf 书签吗?

我有带有广泛(嵌套)书签的 pdf 电子书,这些书签在我所有其他 pdf 阅读器(例如 evince、foxitreader)中都可见。

但是,当我在 Zathura 中打开上述文件时,运行blist会给出:

没有可用的书签

我用 mupdf 和 poppler 插件得到了相同的结果。我在 Arch linux 上运行 Zathura,并从 Arch 官方存储库安装了它(两个版本,mupdf 和 poppler)。

无论如何可以看到这些预先存在的书签,或者Zathura是否只识别自己的书签?

pdf zathura poppler

3
推荐指数
1
解决办法
3168
查看次数

将 A4R(A4 横向)扫描的 jpeg 转换为 A4R(A4 横向)pdf

我已将 A4R 纸张扫描为 2048x1443 jpg 文件。

EDIT1:它已经旋转为横向(2048x1443)。编辑结束 1

现在,如果我尝试使用此命令转换它:

$ convert -page A4R A4R_Scanned.jpg A4R_Scanned.pdf
$ echo $?
0
Run Code Online (Sandbox Code Playgroud)

EDIT2:没有关于 A4R 参数的错误消息。编辑结束2

我收到一封空白的美国信件,肖像页:

$ identify A4R_Scanned.pdf
   **** Warning:  File has an empty MediaBox. Using the current page size instead.
                  Output may be incorrect.
   **** Warning:  File has an empty MediaBox. Using the current page size instead.
                  Output may be incorrect.
A4R_Scanned.pdf PDF 595x842 595x842+0+0 16-bit Bilevel DirectClass 63.2K 
Run Code Online (Sandbox Code Playgroud)

EDIT3:我尝试了另一种解决方案:

$ convert -page A4 -rotate 90 A4R_Scanned.jpg A4R_Scanned2A4.pdf
Run Code Online (Sandbox Code Playgroud)

这提供了令人满意的 A4 文档,没有明显的质量损失,但我需要将其旋转回 …

pdf imagemagick conversion

3
推荐指数
1
解决办法
1909
查看次数