如何使用java从网站中提取数据?

gir*_*iri 6 java screen-scraping

我比java编程语言更熟悉我喜欢从网站中提取数据并将其存储到我的机器上运行的数据库中.这可能在java.If中我应该使用哪种API.例如,网站上列出的学校数量如何使用java提取数据并将其存储到我的数据库中.

luc*_*cas 7

你所指的通常被称为'screenscraping'.在Java中有很多种方法可以做到这一点,但是,我更喜欢HtmlUnit.虽然它被设计为测试Web功能的一种方法,但您可以使用它来访问远程网页并解析它.

我建议使用像Tagsoup这样的错误处理html解析器来从HTML中提取你正在寻找的内容.