我从哪里开始使用Web机器人?

Jon*_*ier 17 python bots

我只想创建一个可以在Web服务器上运行(最好)的自动脚本,只需"点击"网页的对象即可.我是Python的新手或者用于此的任何语言所以我想我会去这里询问从哪里开始!这可能看起来像我希望脚本欺骗广告或做一些非法的事情,但它只是与另一个网站进行交互.

Fru*_*ner 6

它不一定是Python,我已经在PHP和Perl中看到它,你可以用许多其他语言来完成它.一般方法是:

1)您为应用程序提供URL,并向该URL发出HTTP请求.我想我已经看过这个用php/wget完成了.可能还有很多其他方法可以做到这一点.

2)扫描您想要"点击"的其他URL的HTTP响应(实际上,向他们发送HTTP请求),然后向这些URL发送请求.解析链接通常需要对正则表达式有所了解(如果你不熟悉正则表达式,请刷上它 - 这是重要的东西;)).


Ben*_*nno 2

我推荐 Python mechanize库。它被设计为充当模拟浏览器。我用它来通过脚本驱动多个 Web 界面。