如何使用phantomjs将html源打印到控制台

Question

如何使用phantomjs将html源打印到控制台

我刚刚下载并在我的机器上安装了phantomjs.我将以下脚本复制并粘贴到名为hello.js的文件中:

var page = require('webpage').create();
var url = 'https://www.google.com'

page.onLoadStarted = function () {
    console.log('Start loading...');
};

page.onLoadFinished = function (status) {
    console.log('Loading finished.');
phantom.exit();
};

page.open(url);

Run Code Online (Sandbox Code Playgroud)

我想将完整的HTML源(在本例中是从谷歌页面)打印到文件或控制台.我该怎么做呢？

Answer 1

Ari*_*yat 50

花了一些时间阅读文档,之后应该是显而易见的.

var page = require('webpage').create();
page.open('http://google.com', function () {
    console.log(page.content);
    phantom.exit();
});

Run Code Online (Sandbox Code Playgroud)

@toom:当然,因为他是*phantomjs的*创造者:) (28认同)
这将提供来自dom的html(已经被javascript操纵并且经历了一定程度的语法更正),而不是服务器提供的原始未处理的html.有没有办法可以得到它？也许来自onResourceReceived？ (5认同)

归档时间：	13 年，5 月前
查看次数：	24884 次
最近记录：	11 年，1 月前