我有一个已经压缩过的 PDF 和一些人工图像,我正在使用 Ghostscript 为该 PDF 添加一个标题页。
但是,我找不到任何方法告诉 GS 按原样使用现有图像而不重新处理它们,现在我觉得这与 GS 的工作方式有关,即您无法重新编译/链接 PDF没有重新处理它的图像..是真的吗?
我可以在 GS 中提高 DPI 设置,但它会从 5MB 增加到 60MB,同时看起来仍然更糟。
有没有更好的替代 GS 可以满足我的需要(最好是在 OS X 上编译)?
我的问题是我的任务是从 640 页的 PDF 文件中提取图像。
其中大部分是带有文本的图表和表格。进行简单的复制和粘贴会使图像失去分辨率,文本变得模糊,有时甚至无法阅读。
您知道从 PDF 文件中提取图像而不影响分辨率的更好方法吗?
如何轻松地从文件夹中的所有 PDF 中删除所有评论和注释(使用 Foxit Reader 添加)?
此 PDF 由 Abbyy Finereader 10 制作:
http://ebooks.zeitr.org/from_abbyy.pdf
您可以复制并粘贴第一句话并获得此(非常好的)文本结果:
Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20. November 1955 anläßlich einer Zusammenkunft der Leiterinnen und Leiter der privaten deutschen Gymnastik-Ausbildungsstätten gegründet。
在使用 Ghostscript 9.02(64 位 Windows)进行一些处理后,我得到了这个文件:
http://ebooks.zeitr.org/after_ghostscript.pdf
现在第一句话看起来很奇怪 - 每个单词的最后一个字符之前都有一个额外的空格。
Der »Bun d Deutscher r GymnastikSchulleiter « wurd eam 20 . 195 年 11 月 5 月
这有一个主要的负面影响,即您无法在 Acrobat Reader 中搜索整个单词。我可以使用以下为 Ghostscript 设置的最小参数来重现效果:
-sDEVICE=pdfwrite ^
-dBATCH ^
-dNOPAUSE ^
-sstdout="myStdOut" ^
-sOutputFile="myDestFile.pdf" ^
mySourceFile.pdf
Run Code Online (Sandbox Code Playgroud)
有任何想法吗?
我有一个包含 8.5×5.5 英寸纵向页面的 PDF(由 PowerPoint 生成)。
我需要将其转换为 8.5×11 英寸的横向页面,其中每个横向页面并排包含原始(较小)纵向页面的两个副本。
在 ASCII 艺术中:
原创 | 想要的 | |---| | |---| |---| | 1 | | | 1 | | 1 | | 1 | | | 1 | | 1 | |---| | |---| |---| | |---| | |---| |---| | 2 | | | 2 | | 2 | | 2 | | | 2 | | 2 | |---| | |---| |---|
有没有免费的方法可以做到这一点,还是我需要在 C# 中做到这一点?
我想做OCR的反面,我不想把图片转成文字,我想把PDF中的所有文字都转成图片,这样就不能随便选择和复制了。
在 Acrobat Pro 中很好,但我真的很喜欢可以从 Linux 命令行使用的东西,因为我有很多这些 PDF 要做,而且它们目前在网站上。如果我可以在服务器上进行此更改,它将为我节省数小时的下载、在 Acrobat 中处理、重新上传需要通过我的 CMS 界面完成的工作,这非常慢。
因此,如果有一些可以轻松完成此操作的 PDF 工具,我可以从终端使用,那将非常棒。
在 Ghostscript 中,在带有喷墨打印机的 windows xp 电脑上,如何查看系统上可用的字体示例?我需要知道调用它们时调用它们的内容,并且知道进行了哪些替换会很有用。
我有一个这样的文件夹结构,根据主题在目录中包含配方 .md 文件:
Recipes
|- Mains
| |- recipe1.md
| |- recipe2.md
|- Desserts
|- recipe3.md
|- recipe4.md
Run Code Online (Sandbox Code Playgroud)
如何将所有这些 Markdown 文件编译成一本 PDF 书?
我需要每个食谱占据一个单独的页面,标题部分(章节)由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录,它在哪个页面上以及它在哪个章节中。
我可以使用 pandoc 和 LaTeX 来做到这一点吗?或者也许是一个命令行程序来构建维基?
我有一个旧的 reiser 文件系统,我要将其转换为 Ext3。我遇到的问题是确定此分区的正确块和 inode 大小。
该分区有 44 GB 大,必须容纳 3,000,000 多个大小在 1 kb 到 10kb 之间的文件,我如何确定 inode 和块大小的最佳比率?
下面是我尝试过的东西,看起来不错,但使复制文件非常慢。
mkfs.ext3 \
-t ext3 \
-c \
-c \
-b 1024 \
-i 4096 \
-I 128 \
-v \
-j \
-O sparse_super,filetype,has_journal\
/dev/sdb1
Run Code Online (Sandbox Code Playgroud)
谢谢。
我有一个 pdf 文件,我想知道我是否可以将其所有字体嵌入/子集到 PDF 文件本身中?有没有支持这个操作的工具?
pdf ×8
ghostscript ×5
bash ×1
batch ×1
conversion ×1
ext3 ×1
filesystems ×1
fonts ×1
images ×1
inode ×1
linux ×1
manipulation ×1
markdown ×1
ocr ×1
pandoc ×1
pdf-reader ×1
pdftk ×1
postscript ×1
print-to-pdf ×1