adr*_*anX 2 html pdf wkhtmltopdf
wkhtmltopdf 上的这个问题有一个特定的组件和一个更通用的组件。
通常:我正在尝试将各种网页提取到 pdf 文件中,并且我希望 wkhtmltopdf 在尽可能多的情况下工作。它是一个非常好的工具,但我经常遇到无法转换网页的问题。你们有一套与 wkhtmltopdf 一起使用的标志吗?
具体来说:例如,一个不是很远的网页,但我遇到的问题是http://gizmodo.com/microsoft-surface-book-review-so-good-i-might-switch-1737680767 . 当我在没有任何标志的情况下运行 wkhtmltopdf 时(在 Windows 中),我得到以下信息:
>>wkhtmltopdf http://gizmodo.com/microsoft-surface-book-
review-so-good-i-might-switch-1737680767 blah.pdf
Loading pages (1/6)
Error: Failed loading page http://gizmodo.com/microsoft-surface-book-review-so-g
ood-i-might-switch-1737680767 (sometimes it will work just to ignore this error
with --load-error-handling ignore)
Warning: A finished ResourceObject received a loading progress signal. This migh
t be an indication of an iframe taking too long to load.
Warning: Received createRequest signal on a disposed ResourceObject's NetworkAcc
essManager. This might be an indication of an iframe taking too long to load.
Exit with code 1, due to unknown error.
Run Code Online (Sandbox Code Playgroud)
如果我按照说明使用该--load-error-handling ignore标志,则会生成 PDF 文件,但它是空的。我如何让 wkhtmltopdf 与这个网页一起工作?
我尝试使用 rasterize.js 查看其他工具,例如 phantomJS,但它有自己的一系列问题......
谢谢你们!
当启用 Javascript 并且完成速度太慢时会发生这种情况。如果您需要运行 javascript 来解决此问题,请添加:
--javascript-delay 100000
Run Code Online (Sandbox Code Playgroud)
它调整 Javascript 完成的等待时间(以毫秒为单位)。所以在上面的例子中,它等待了 100 秒。请注意,如果您一次运行多文档转换,则此设置适用于整个运行,而不是每个单独的文档。因此,如果您在单个 pdf 输出中转换大约 100 个输入 html,则可能需要更长的延迟。
我还添加到我的脚本中:
--no-stop-slow-scripts
Run Code Online (Sandbox Code Playgroud)
这使:不要停止运行缓慢的javascripts。
| 归档时间: |
|
| 查看次数: |
5140 次 |
| 最近记录: |