有些人帮助用Java抓取页面

Mri*_*lla 6 html java xhtml screen-scraping

我需要使用Java来抓取一个网页,我已经读过正则表达式是一种非常低效的方法,我应该把它放到DOM文档中进行导航.

我试过阅读文档,但它似乎太广泛,我不知道从哪里开始.

你能告诉我如何把这张桌子刮成阵列吗?我可以尝试从那里找出方法.一个片段/示例也可以.

谢谢.

Dee*_*wat 7

您可以尝试jsoup:Java HTML Parser.这是一个很好的图书馆,有很好的示例代码.