我已经在使用puppeteer来抓取我的页面,但是,我还需要原始 html(基本上是页面源)。
我知道我可以获取原始 html,但也许 puppeteer 已将其保存在某个地方。
puppeteer 在 goto() 之后是否保存页面源代码?
Yev*_*kov 10
该goto方法返回一个解析为主要资源响应的承诺。所以你可以这样做:
const response = await page.goto(url);
console.log(await response.text());
Run Code Online (Sandbox Code Playgroud)
但我建议使用该page.content()方法来获取页面的完整 HTML 内容,包括文档类型。阅读更多有关内容。
| 归档时间: |
|
| 查看次数: |
8400 次 |
| 最近记录: |