Ted*_*son 5 screen-scraping node.js
我正在尝试使用node.js进行一些网页抓取.使用jsdom,很容易加载DOM并将JavaScript注入其中.我想更进一步:从网页运行链接到的所有JavaScript,然后检查生成的DOM,包括元素的可视属性(高度,宽度等).
到目前为止,NaN当我尝试用jsdom检查DOM元素的维度时,我得到了.
这可能吗?
令我感到震惊的是,有两个截然不同的挑战:
提出问题的另一种方法是:是否可以将node.js用作可以编写脚本的完全无头浏览器?
如果这是不可能的,有没有人建议我可以使用哪些库来执行此操作?我相对语言不可知.
您可以使用:
所有这些解决方案也可以运行 javascript。
您可以直接从http://stackoverflow.com搜索中找到许多示例代码
| 归档时间: |
|
| 查看次数: |
5037 次 |
| 最近记录: |