标签: pdf

清理 pdftotext 字体问题

我用来pdftotext制作 PDF 文档的 ASCII 版本(用 LaTeX 制作),因为协作者更喜欢 MS Word 中的简单文档。

\n\n

我看到的纯文本版本看起来不错,但经过​​仔细检查,f 字符似乎经常被错误转换,具体取决于后面的字符。例如,fi 和 fl 通常似乎成为一个特殊字符,我将尝试将其粘贴到此处:\xef\xac\x81 和 \xef\xac\x82。

\n\n

清理 pdftotext 输出的最佳方法是什么?我认为sed可能是正确的工具,但我不确定如何检测这些特殊字符。

\n

pdf ascii special-characters conversion

6
推荐指数
1
解决办法
9660
查看次数

受密码保护的 PDF 无法在 Linux 上打开

我有一个 PDF 文档(从大英图书馆通过馆际互借获得),它通过某种远程密码验证受到密码保护。我试图在 Ubuntu 14.04 上打开它,但失败了。

似乎 ADE(Adobe 数字版)是必需的,但不适用于 Linux。我将报告问题和一些尝试的解决方案。

问题:

  • Acroread(9.5.5 版)打开时显示一条消息“您需要连接到 Internet”(我就是这样)并立即关闭。
  • Evince(版本 3.10.3)要求输入密码并出现控制台错误“语法错误:找不到‘Adobe.APS’安全处理程序”。我怀疑我错过了这个“安全处理程序”。

PDF 的说明说明了什么:

  • 我可以在与下载文档的 PC 不同的 PC 上阅读我的文档吗?

    可以,只要使用与您打开文档的第一台 PC 相同的 Adob​​e ID 激活 PC。当您单击链接时,您会收到一个 acsm 文件,这是从我们的服务器下载 PDF 文件的“密钥”。这个 acsm 文件不是文档本身。但是,它可以保存到记忆棒上并转移到另一台 PC 上使用。与 FileOpen 一样,另一台 PC 需要具有 Internet 连接。我们建议您不要采用这种方法,只需单击您希望打开文档的其他 PC 上发送给您的链接(记住它们必须使用相同的 Adob​​e ID 激活)。

尝试的解决方案:

linux pdf wine adobe-acrobat ubuntu

6
推荐指数
1
解决办法
3499
查看次数

如何删除 Adob​​e acrobat Reader DC 工具栏不需要的按钮/链接?

Adobe acrobat reader DC 在工具栏上添加了一大堆按钮/链接。我想去掉主页、工具、文档、帮助、手机和登录(请看截图)。

有没有办法从工具栏中删除这些?它在工具栏上占用了太多的空间而没有为我增加任何价值。

工具栏上不需要的菜单

pdf adobe-reader adobe-acrobat

6
推荐指数
1
解决办法
1万
查看次数

pdftk flatten 丢失可填写的字段数据

我正在尝试制定一个解决方案,以在 Linux 命令行上使用已填写的字段来展平 PDF。起初我在搞鬼,但我发现它倾向于将所有字段数据转换为垃圾字符。

当我运行此命令时

pdftk foo.pdf output bar.pdf flatten
Run Code Online (Sandbox Code Playgroud)

bar.pdf在 PDF 阅读器中打开,它变平了,但字段中的数据根本不存在。PDF 就像没有填写一样,减去可填写的字段。

有什么我在这里想念的吗?

我在谷歌上找到的所有解决方案都是关于用.fdf文件填充空表单,这与我的情况并不真正相关。

pdf pdftk

6
推荐指数
1
解决办法
6702
查看次数

将其他格式注册为 PDF 以在 Windows 7 中预览

根据此问题和答案,可以在Windows 7 的预览窗口中以文本形式查看其他文件类型。

现在我有一个相关案例:我想在预览窗口中预览 AI(Illustrator)文件。由于 AI 文件嵌入在 PDF 文件中,如果我将文件扩展名更改为 PDF,它可以很好地预览。在我看来,应该可以注册 AI 以使用相同的处理程序。

在此处输入图片说明

图 1:时间捕获显示与 PDF 相同的文件预览,但与 AI 不同

我尝试盲目设置Content TypePerceivedType即使在 MSDN 上进行了几个星期的轻松搜索,也没有成功。所以如果有人知道:

  • 我如何确定我应该使用哪个处理程序?
  • 如何注册该处理程序以供使用?

但是,请记住,我希望 AI 为所有其他目的保留与 PDF 不同的格式。

windows-registry windows-7 pdf adobe-illustrator

6
推荐指数
1
解决办法
1707
查看次数

自定义 Okular 以添加我自己的注释“图章”

有一个关于Okular的定制在修改高亮工具性能优良的后 定制Okular中修改的亮点工具属性 这是有益的,但它与修改现有的工具功能的交易。我想添加我自己的注释“图章”,以便通过单击或两次单击将它们放置在 PDF 文档中。我怀疑它涉及修改 tool.xml 文件并将“图章”的 .png 文件添加到文件夹中。更具体的指导将不胜感激。

linux pdf annotations okular

6
推荐指数
1
解决办法
4339
查看次数

如何阻止 Adob​​e Reader 更新?

Adobe Reader 自动更新到版本 15.023.20053 后,我无法再打印 PDF。

我恢复到之前安装的版本 (15.020.20042) 并且能够正常打印,但 Adob​​e Reader 一直在尝试更新。

如何阻止 Adob​​e Reader 更新(和破坏)自身?

pdf printing adobe-reader

6
推荐指数
1
解决办法
2723
查看次数

从多个 Markdown 文件编译 PDF 书

我有一个这样的文件夹结构,根据主题在目录中包含配方 .md 文件:

Recipes
    |- Mains
    |   |- recipe1.md
    |   |- recipe2.md
    |- Desserts
        |- recipe3.md
        |- recipe4.md
Run Code Online (Sandbox Code Playgroud)

如何将所有这些 Markdown 文件编译成一本 PDF 书?

我需要每个食谱占据一个单独的页面,标题部分(章节)由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录,它在哪个页面上以及它在哪个章节中。

我可以使用 pandoc 和 LaTeX 来做到这一点吗?或者也许是一个命令行程序来构建维基?

pdf bash markdown pandoc

6
推荐指数
1
解决办法
3389
查看次数

从命令行删除 PDF 中的空白页

我有一个插入了一些空白页的 PDF。这些页面是背景颜色(在这种情况下为灰色)。我想使用 bash 脚本删除这些页面。

有人建议我们可以使用 eg 扫描文本pdftotext,但在我的情况下,即使在非空白页面上也找不到文本。

pdf shell

6
推荐指数
2
解决办法
5878
查看次数

如何删除包含 150,000 种嵌入字体的 PDF 文档中的重复字体?

我正在分析一个 PDF 文件,看看它为什么这么大(400MB),以及我有什么方法可以减小它的大小。

PDF 文件是通过合并大约 15,000 个较小的 PDF 文件生成的,这些文件是使用模板生成的,理论上应该具有相同的字体集。这些小的 PDF 文件是由第三方系统生成的,对我们来说是一个黑匣子。

我怀疑每个字体在合并的 PDF 文件中被多次添加,所以我认为作为第一步,我可以通过删除重复的字体来减小其文件大小。

使用pdffonts我检查了单个小型 PDF 文件之一中使用的字体:

$ pdffonts small-00001.pdf
name                                 type              encoding         emb sub uni object ID
------------------------------------ ----------------- ---------------- --- --- --- ---------
[none]                               Type 3            Custom           yes no  yes      6  0
[none]                               Type 3            Custom           yes no  yes     25  0
[none]                               Type 3            Custom           yes no  yes     56  0
[none]                               Type 3            Custom           yes no  yes     95  0
[none]                               Type 3            Custom           yes no  yes …
Run Code Online (Sandbox Code Playgroud)

fonts pdf

6
推荐指数
1
解决办法
1033
查看次数