使用 Puppeteer 获取所有纯文本

pyp*_*ypu 10 javascript puppeteer

我可以使用 Puppeteer 获取页面的所有代码,但如何只能获取纯文本?没有标签?

const puppeteer = require('puppeteer');

(async() => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://google.com');
  console.log(await page.content()); //Get all code
  await browser.close();
})();
Run Code Online (Sandbox Code Playgroud)

Ori*_*ori 9

我没有尝试过,但$eval可能对你有用:

await page.$eval('*', el => el.innerText);
Run Code Online (Sandbox Code Playgroud)