我用来pdftotext制作 PDF 文档的 ASCII 版本(用 LaTeX 制作),因为协作者更喜欢 MS Word 中的简单文档。
我看到的纯文本版本看起来不错,但经过仔细检查,f 字符似乎经常被错误转换,具体取决于后面的字符。例如,fi 和 fl 通常似乎成为一个特殊字符,我将尝试将其粘贴到此处:\xef\xac\x81 和 \xef\xac\x82。
\n\n清理 pdftotext 输出的最佳方法是什么?我认为sed可能是正确的工具,但我不确定如何检测这些特殊字符。
我有一个 PDF 文档(从大英图书馆通过馆际互借获得),它通过某种远程密码验证受到密码保护。我试图在 Ubuntu 14.04 上打开它,但失败了。
似乎 ADE(Adobe 数字版)是必需的,但不适用于 Linux。我将报告问题和一些尝试的解决方案。
问题:
PDF 的说明说明了什么:
我可以在与下载文档的 PC 不同的 PC 上阅读我的文档吗?
可以,只要使用与您打开文档的第一台 PC 相同的 Adobe ID 激活 PC。当您单击链接时,您会收到一个 acsm 文件,这是从我们的服务器下载 PDF 文件的“密钥”。这个 acsm 文件不是文档本身。但是,它可以保存到记忆棒上并转移到另一台 PC 上使用。与 FileOpen 一样,另一台 PC 需要具有 Internet 连接。我们建议您不要采用这种方法,只需单击您希望打开文档的其他 PC 上发送给您的链接(记住它们必须使用相同的 Adobe ID 激活)。
尝试的解决方案:
我的 Acroread 可能缺少一个合适的插件(我找到了此类通用建议),但我看不到应该是哪个插件,也不知道在哪里以及如何将它添加到我的 Acrobat Reader 中。
http://www.avilpage.com/2014/10/how-to-install-adobe-digital-editions.html建议先安装 Windows 模拟器 Wine,然后在 Ubuntu 上安装 ADE1.7 作为 Windows 程序。ADE1.7 的仿真可以工作,但不能识别 PDF 的这种远程验证。
https://appdb.winehq.org/objectManager.php?sClass=application&iId=6326的下一个更高版本的 Wine ADE_3.0_Installer.exe 在我的 Ubuntu 系统上不起作用,这意味着 Wine 程序不足。
Adobe acrobat reader DC 在工具栏上添加了一大堆按钮/链接。我想去掉主页、工具、文档、帮助、手机和登录(请看截图)。
有没有办法从工具栏中删除这些?它在工具栏上占用了太多的空间而没有为我增加任何价值。
我正在尝试制定一个解决方案,以在 Linux 命令行上使用已填写的字段来展平 PDF。起初我在搞鬼,但我发现它倾向于将所有字段数据转换为垃圾字符。
当我运行此命令时
pdftk foo.pdf output bar.pdf flatten
Run Code Online (Sandbox Code Playgroud)
并bar.pdf在 PDF 阅读器中打开,它变平了,但字段中的数据根本不存在。PDF 就像没有填写一样,减去可填写的字段。
有什么我在这里想念的吗?
我在谷歌上找到的所有解决方案都是关于用.fdf文件填充空表单,这与我的情况并不真正相关。
根据此问题和答案,可以在Windows 7 的预览窗口中以文本形式查看其他文件类型。
现在我有一个相关案例:我想在预览窗口中预览 AI(Illustrator)文件。由于 AI 文件嵌入在 PDF 文件中,如果我将文件扩展名更改为 PDF,它可以很好地预览。在我看来,应该可以注册 AI 以使用相同的处理程序。
图 1:时间捕获显示与 PDF 相同的文件预览,但与 AI 不同
我尝试盲目设置Content Type,PerceivedType即使在 MSDN 上进行了几个星期的轻松搜索,也没有成功。所以如果有人知道:
但是,请记住,我希望 AI 为所有其他目的保留与 PDF 不同的格式。
有一个关于Okular的定制在修改高亮工具性能优良的后 定制Okular中修改的亮点工具属性 这是有益的,但它与修改现有的工具功能的交易。我想添加我自己的注释“图章”,以便通过单击或两次单击将它们放置在 PDF 文档中。我怀疑它涉及修改 tool.xml 文件并将“图章”的 .png 文件添加到文件夹中。更具体的指导将不胜感激。
Adobe Reader 自动更新到版本 15.023.20053 后,我无法再打印 PDF。
我恢复到之前安装的版本 (15.020.20042) 并且能够正常打印,但 Adobe Reader 一直在尝试更新。
如何阻止 Adobe Reader 更新(和破坏)自身?
我有一个这样的文件夹结构,根据主题在目录中包含配方 .md 文件:
Recipes
|- Mains
| |- recipe1.md
| |- recipe2.md
|- Desserts
|- recipe3.md
|- recipe4.md
Run Code Online (Sandbox Code Playgroud)
如何将所有这些 Markdown 文件编译成一本 PDF 书?
我需要每个食谱占据一个单独的页面,标题部分(章节)由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录,它在哪个页面上以及它在哪个章节中。
我可以使用 pandoc 和 LaTeX 来做到这一点吗?或者也许是一个命令行程序来构建维基?
我有一个插入了一些空白页的 PDF。这些页面是背景颜色(在这种情况下为灰色)。我想使用 bash 脚本删除这些页面。
有人建议我们可以使用 eg 扫描文本pdftotext,但在我的情况下,即使在非空白页面上也找不到文本。
我正在分析一个 PDF 文件,看看它为什么这么大(400MB),以及我有什么方法可以减小它的大小。
PDF 文件是通过合并大约 15,000 个较小的 PDF 文件生成的,这些文件是使用模板生成的,理论上应该具有相同的字体集。这些小的 PDF 文件是由第三方系统生成的,对我们来说是一个黑匣子。
我怀疑每个字体在合并的 PDF 文件中被多次添加,所以我认为作为第一步,我可以通过删除重复的字体来减小其文件大小。
使用pdffonts我检查了单个小型 PDF 文件之一中使用的字体:
$ pdffonts small-00001.pdf
name type encoding emb sub uni object ID
------------------------------------ ----------------- ---------------- --- --- --- ---------
[none] Type 3 Custom yes no yes 6 0
[none] Type 3 Custom yes no yes 25 0
[none] Type 3 Custom yes no yes 56 0
[none] Type 3 Custom yes no yes 95 0
[none] Type 3 Custom yes no yes …Run Code Online (Sandbox Code Playgroud)