zub*_*hta 7 jquery node.js web-scraping jsdom
可能是nodejs/jsdom上的新手问题
我试图使用node.js刮一个网站.我正在使用jsdom和jquery来获取html并解析所需的东西.但是,不知何故,我得到的价值不是网站上显示的价值.基本上这些值是由javascript动态更改的,我想要这些值.我使用nodejs/jsdom进行抓取的全部原因是js将被执行并且我在该事件之后得到值.
有没有办法让jsdom等到javascript执行?或者我错了吗?我在这件事上搜索了很多东西.
你最好使用像casperjs这样的东西http://casperjs.org/.它是一个基于phantomjs的测试实用程序.它基本上就像在webkit浏览器中打开页面一样,没有GUI.你可以写点像.我不认为它适用于节点,但它应该很容易运行一个casper脚本并将输出管道传回节点:
var casper = require('casper').create({
loadImages: true,
loadPlugins: true,
verbose: true,
//logLevel: 'info',
clientScripts: [
'jquery-1.7.1.min.js',
],
viewportSize: {
width: 1366,
height: 768,
},
pageSettings: {
javascriptEnabled: true,
userAgent: 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5',
},
});
casper.start(url);
casper.thenEvaluate(function () {
//javascript code to run in the scope of the page
});
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
3708 次 |
最近记录: |