在Perl中使用JavaScript支持的Web Crawler?

Ωme*_*ega 2 html javascript browser perl

我想编写一个perl应用程序,它会抓取一些网站并从这些网页收集图像链接.因为大多数页面使用生成HTML内容的JavaScript,所以我需要使用JavaScript支持编码客户端浏览器,以便能够解析由JavaScript生成和/或修改的最终HTML代码.我有什么选择?

如果可能,请发布一些实现代码或链接到一些示例.

Que*_*tin 7

有几种选择.

  • "我有什么选择?" 是个问题.模块列表似乎是一个很好的选项列表. (4认同)

Tro*_*ott 5

想到的选择:

  • 您可以让Perl使用Selenium并拥有一个成熟的浏览器为您完成工作.

  • 您可以下载并编译V8或其他开源JavaScript引擎,并让Perl调用外部程序来评估JavaScript.

  • 我不认为Perl的LWP模块支持JavaScript,但如果你还没有这样做,你可能想检查一下.