一个更好的维基百科页面到 PDF 工具?

z0q*_*0vk 6 pdf

我知道维基百科有一个从页面创建 PDF 的工具,但我真的想要一个具有这些功能的更好的工具:

  1. 如果目标页面也在书中,则更改指向多页书籍文章内书签的超链接。
  2. 更好的内容层。
  3. 如果可能,自动更新页面...

有什么建议吗?

Kur*_*fle 7

哦,这个问题来得正是时候:-)

因为就在昨晚,我使用这个奇妙的prince实用程序,从不同的维基百科输入文章中为自己创建了一个 PDF 。该命令仍在我的 bash 历史记录中:

time prince \
   --verbose \
   --no-author-style \
   --style=http://www.princexml.com/howcome/2008/wikipedia/wiki2.css \
     http://en.wikipedia.org/wiki/Color_management \
     http://en.wikipedia.org/wiki/Gamut \
     http://en.wikipedia.org/wiki/RGB \
     http://en.wikipedia.org/wiki/CMYK \
     http://en.wikipedia.org/wiki/Color_space \
     http://en.wikipedia.org/wiki/ICC_profile \
     http://en.wikipedia.org/wiki/Color_calibration\
     http://en.wikipedia.org/wiki/Linux_color_management \
   --output=prince-colormanagement-wikipedia.pdf
Run Code Online (Sandbox Code Playgroud)

下载所有必需的文件(它使用远程 CSS 样式表文件,以及它在线获取的免费字体(Gentium)......)并编写 PDF 只用了 3 分钟。

Prince无需注册即可下载使用。然而,它仍然是一个商业软件:它可以免费用于非商业目的——但在这种情况下,您将不得不在 PDF 的第一页上使用一个很小的、相当不显眼的徽标。

这是当您不支付软件费用时必须使用的小王子徽标,出现在 PDF 第一页的右上角:

第一个 PDF 页面的左上角显示小“王子”标志......

这是生成的 PDF 的屏幕截图,其中显示了 Linux 上的 Acrobat Reader 中的页面和部分展开的书签窗格:

来自多篇带有书签的维基百科文章的王子生成的 PDF 的屏幕截图

如您所见,所有包含的文章的所有书签都在那里。

您还将注意到,prince 正确实现了样式表的 2 列排版。(如果您是 CSS 大师,您可以轻松创建自己的样式表,使用您自己的字体首选项等来创建您喜欢的 Wikipedia 书籍样式。)

Prince 不仅适用于 Linux,还适用于 Windows、Solaris 和 Mac OS X。


更新:只是为了与您想要的功能进行比较:

  1. “如果目标页面也在书中,则更改指向多页书籍文章内书签的超链接。”
    • 这个工具在这里完全可以做你想做的。
  2. “更好的内容层。”
    • 老实说,我不明白你的意思。但是,由于您可以修改自己的样式表并让 Prince 将其应用于输出,因此对您来说“更好的内容”是没有限制的。
  3. “如果可能,自动更新页面……
    • 您必须根据prince命令行编写自己的脚本才能做到这一点。它将使用 cronjob 来检查构成您的书的任何维基百科文章是否已更改。如果是这样,请prince再次运行该命令。对于修改的cronjob检查可以使用curl维基百科的API,以便查询文章的最后更改了日期。