递归 HTML 到 PDF

Mat*_*zzi 12 pdf html

我有一个具有这种结构的文件夹:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html
Run Code Online (Sandbox Code Playgroud)

有许多子文件夹,只有 html 文件......我想只使用一个命令或一个不需要所有文件名的简单脚本将它们全部转换为 pdf。

你知道一个

dan*_*der 15

我建议从http://wkhtmltopdf.org/安装 WKHtmlToPDF 工具(移自:http : //code.google.com/p/wkhtmltopdf/)。

然后您可以切换到根文件夹并使用 find 和 xargs 来转换它们:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf
Run Code Online (Sandbox Code Playgroud)

然后,这将使用每个 HTML 文件构建一个 PDF。


jco*_*ado 5

以下命令应该为一个链接完成这项工作:

gnome-web-print http://www.ubuntu.com ubuntu.pdf
Run Code Online (Sandbox Code Playgroud)

对于多个链接,编写一个循环来逐个处理每个链接应该不难。