小编Lau*_*Kay的帖子

节点js puppeteer元数据

我是Puppeteer的新手,我正在尝试使用Node.JS和Puppeteer从网站中提取元数据.我似乎无法正确使用语法.下面的代码使用两种不同的方法以及段落标记中的文本来完美地提取Title标记.如何提取名称为"description"的元数据的内容文本?

meta name ="description"content ="Stack Overflow是最大的,等等"

我会非常感谢任何建议!我似乎无法在任何地方找到任何这样的例子(5小时的搜索和代码黑客攻击).我的示例代码:

const puppeteer = require('puppeteer');

async function main() {
  const browser = await puppeteer.launch({headless: false});
  const page = await browser.newPage();
  await page.goto('https://stackoverflow.com/', {waitUntil: 'networkidle2'});

  const pageTitle1 = await page.evaluate(() => document.querySelector('title').textContent);
  const pageTitle2 = await page.title();
  const innerText = await page.evaluate(() => document.querySelector('p').innerText);
  console.log(pageTitle1);
  console.log(pageTitle2);
  console.log(innerText);
};  

main();
Run Code Online (Sandbox Code Playgroud)

meta-tags node.js puppeteer

3
推荐指数
1
解决办法
1576
查看次数

标签 统计

meta-tags ×1

node.js ×1

puppeteer ×1