如何编写可以在网页上浏览和操作的自动化机器人

Tun*_*soy 2 java screen-scraping bots

我需要编写一个需要执行以下操作的机器人:

转到jsp页面并按以下方式搜索:

  • 1:在搜索框上写点东西
  • 2:点击搜索按钮(提交按钮)
  • 3:单击生成的按钮/链接之一(具有不同输出的相同jsp页面)
  • 4:获取新页面的整个html(具有不同输出的相同jsp页面)

第四个可以用屏幕抓取完成,我认为我不需要它的帮助.但我需要一些指导,从1到3做选项.任何链接或只是一些关键字,将帮助我谷歌了解它将不胜感激.我打算用java做这个.

Cly*_*obo 9

您只需要HTMLUnit

这是其描述的摘录

HtmlUnit is a "GUI-Less browser for Java programs". It models HTML documents and provides an API that allows you to invoke pages, fill out forms, click links, etc... just like you do in your "normal" browser.

PS:曾用它来构建网络抓取项目;)


joe*_*di1 6

也许这不是你想要的,但你可以试试selenium:http://seleniumhq.org/

这是一个Web应用程序测试系统.