小编let*_*ljd的帖子

使用cheerio访问脚本内容

我正在使用 Cheerio 并通过 Node.js 请求进行一些基本的网络抓取,但似乎无法弄清楚如何访问数据。该页面通过请求加载,我可以使用 Cheerio 控制台.log 页面标题,但是当我访问脚本时,它是一堆复杂的对象。

在页面的正文部分,它看起来像..

<body> 
  <script src="someUrl" script type="text/javascript" /> 
  <script src="someUrl" script type="text/javascript" /> 
  <script src="someUrl" script type="text/javascript" />
  <script type="text/javascript">var months = [6,12,24,36,48,60]; var amounts = [5000,10000,15000,20000,25000]</script>
Run Code Online (Sandbox Code Playgroud)

我试图获取最后一个脚本中的变量,将它们作为变量存储在我的节点脚本中以供使用,但我似乎无法访问它们,即使是文本。

当我在节点中尝试这个时,我得到页面标题,然后是控制台中一些巨大的对象响应,而不是要解析的变量文本。建议?

$ = cheerio.load(body);
console.log($('title').text());
var text = $('script');
console.dir(text[3]);
Run Code Online (Sandbox Code Playgroud)

node.js web-scraping web cheerio

0
推荐指数
1
解决办法
4686
查看次数

标签 统计

cheerio ×1

node.js ×1

web ×1

web-scraping ×1