小编Kur*_*fle的帖子

使用 Ghostscript,但告诉它不要重新处理图像?

我有一个已经压缩过的 PDF 和一些人工图像,我正在使用 Ghostscript 为该 PDF 添加一个标题页。

但是,我找不到任何方法告诉 GS 按原样使用现有图像而不重新处理它们,现在我觉得这与 GS 的工作方式有关,即您无法重新编译/链接 PDF没有重新处理它的图像..是真的吗?

我可以在 GS 中提高 DPI 设置,但它会从 5MB 增加到 60MB,同时看起来仍然更糟。

有没有更好的替代 GS 可以满足我的需要(最好是在 OS X 上编译)?

pdf ghostscript pdftk

34
推荐指数
1
解决办法
2万
查看次数

在不影响分辨率的情况下提取 PDF 中的图像?

我的问题是我的任务是从 640 页的 PDF 文件中提取图像。

其中大部分是带有文本的图表和表格。进行简单的复制和粘贴会使图像失去分辨率,文本变得模糊,有时甚至无法阅读。

您知道从 PDF 文件中提取图像而不影响分辨率的更好方法吗?

pdf images

32
推荐指数
3
解决办法
10万
查看次数

从 PDF 文件中批量删除注释

如何轻松地从文件夹中的所有 PDF 中删除所有评论和注释(使用 Foxit Reader 添加)?

pdf batch ghostscript

20
推荐指数
4
解决办法
1万
查看次数

通过 Ghostscript 运行后,PDF 在所有单词中都有一个额外的空白

此 PDF 由 Abbyy Finereader 10 制作:

http://ebooks.zeitr.org/from_abbyy.pdf

您可以复制并粘贴第一句话并获得此(非常好的)文本结果:

Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20. November 1955 anläßlich einer Zusammenkunft der Leiterinnen und Leiter der privaten deutschen Gymnastik-Ausbildungsstätten gegründet。

在使用 Ghostscript 9.02(64 位 Windows)进行一些处理后,我得到了这个文件:

http://ebooks.zeitr.org/after_ghostscript.pdf

现在第一句话看起来很奇怪 - 每个单词的最后一个字符之前都有一个额外的空格。

Der »Bun d Deutscher r GymnastikSchulleiter « wurd eam 20 . 195 年 11 月 5 月

这有一个主要的负面影响,即您无法在 Acrobat Reader 中搜索整个单词。我可以使用以下为 Ghostscript 设置的最小参数来重现效果:

-sDEVICE=pdfwrite ^
-dBATCH ^
-dNOPAUSE ^
-sstdout="myStdOut" ^
-sOutputFile="myDestFile.pdf" ^
 mySourceFile.pdf
Run Code Online (Sandbox Code Playgroud)

有任何想法吗?

pdf ocr ghostscript

10
推荐指数
2
解决办法
5741
查看次数

PDF 处理:“2-Up”页面布局

我有一个包含 8.5×5.5 英寸纵向页面的 PDF(由 PowerPoint 生成)。

我需要将其转换为 8.5×11 英寸的横向页面,其中每个横向页面并排包含原始(较小)纵向页面的两个副本。

在 ASCII 艺术中:

原创 | 想要的
           | 
  |---| | |---| |---|
  | 1 | | | 1 | | 1 |
  | 1 | | | 1 | | 1 |
  |---| | |---| |---|
           |
  |---| | |---| |---|
  | 2 | | | 2 | | 2 |
  | 2 | | | 2 | | 2 |
  |---| | |---| |---|

有没有免费的方法可以做到这一点,还是我需要在 C# 中做到这一点?

pdf manipulation

7
推荐指数
1
解决办法
1957
查看次数

如何以编程方式更改/保护 PDF 中的文本内容,使其不再是可复制的文本?

我想做OCR的反面,我不想把图片转成文字,我想把PDF中的所有文字都转成图片,这样就不能随便选择和复制了。

在 Acrobat Pro 中很好,但我真的很喜欢可以从 Linux 命令行使用的东西,因为我有很多这些 PDF 要做,而且它们目前在网站上。如果我可以在服务器上进行此更改,它将为我节省数小时的下载、在 Acrobat 中处理、重新上传需要通过我的 CMS 界面完成的工作,这非常慢。

因此,如果有一些可以轻松完成此操作的 PDF 工具,我可以从终端使用,那将非常棒。

pdf

7
推荐指数
2
解决办法
3160
查看次数

Ghostscript:如何找出可用的字体?

在 Ghostscript 中,在带有喷墨打印机的 windows xp 电脑上,如何查看系统上可用的字体示例?我需要知道调用它们时调用它们的内容,并且知道进行了哪些替换会很有用。

fonts ghostscript postscript

6
推荐指数
1
解决办法
4474
查看次数

从多个 Markdown 文件编译 PDF 书

我有一个这样的文件夹结构,根据主题在目录中包含配方 .md 文件:

Recipes
    |- Mains
    |   |- recipe1.md
    |   |- recipe2.md
    |- Desserts
        |- recipe3.md
        |- recipe4.md
Run Code Online (Sandbox Code Playgroud)

如何将所有这些 Markdown 文件编译成一本 PDF 书?

我需要每个食谱占据一个单独的页面,标题部分(章节)由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录,它在哪个页面上以及它在哪个章节中。

我可以使用 pandoc 和 LaTeX 来做到这一点吗?或者也许是一个命令行程序来构建维基?

pdf bash markdown pandoc

6
推荐指数
1
解决办法
3389
查看次数

如何为 linux 文件系统计算适当数量的 inode/block 大小

我有一个旧的 reiser 文件系统,我要将其转换为 Ext3。我遇到的问题是确定此分区的正确块和 inode 大小。

该分区有 44 GB 大,必须容纳 3,000,000 多个大小在 1 kb 到 10kb 之间的文件,我如何确定 inode 和块大小的最佳比率?

下面是我尝试过的东西,看起来不错,但使复制文件非常慢。

mkfs.ext3 \
 -t ext3 \
 -c \
 -c \
 -b 1024 \
 -i 4096 \
 -I 128 \
 -v \
 -j \
 -O sparse_super,filetype,has_journal\
  /dev/sdb1
Run Code Online (Sandbox Code Playgroud)

谢谢。

linux filesystems ext3 inode conversion

5
推荐指数
1
解决办法
2万
查看次数

如何将字体嵌入到 PDF 中

我有一个 pdf 文件,我想知道我是否可以将其所有字体嵌入/子集到 PDF 文件本身中?有没有支持这个操作的工具?

pdf print-to-pdf ghostscript pdf-reader adobe-acrobat

5
推荐指数
1
解决办法
2186
查看次数