Python基于Web的Bot

use*_*088 3 html python bots

我正在尝试编写一个基于Python的Web Bot,它可以读取和解释HTML页面,然后执行onClick函数并接收生成的新HTML页面.我已经可以阅读HTML页面,我可以确定onClick命令要调用的函数,但我不知道如何执行这些函数或如何接收生成的HTML代码.

有任何想法吗?

ste*_*han 5

Python中用于Javascript的唯一工具,我知道的是python-spidermonkey.我从来没用过它.

使用Jython,你可以(ab-)使用HttpUnit.

编辑:忘了你可以使用Scrapy.它通过Spidermonkey支持Javascript,甚至可以使用Firefox来抓取网页.

编辑2:最近,由于一些优秀的库,我发现自己越来越多地使用浏览器自动化来完成这些任务.QtWebKit提供对WebKit浏览器的完全访问权限,由于语言绑定(PySidePyQt),可以在Python中使用它.似乎有类似的Gtk +库和绑定,我还没有尝试过.Selenium WebDriver API也很有用,并且有一个活跃的社区.