相关疑难解决方法(0)

如何从servlet获取给定URL的源代码?

我想从我的servlet中读取给定URL的源代码(HTML标记).

例如,URL是http://www.google.com,我的servlet需要阅读HTML源代码.为什么我需要这个,我的Web应用程序将阅读其他网页并获取有用的内容并使用它做一些事情.

可以说,我的应用程序显示了一个城市中一个类别的商店列表.如何生成该列表,我的Web应用程序(servlet)通过给定的网页显示各种商店和阅读内容.使用源代码,我的servlet过滤源并获取有用的详细信息.最后创建列表(因为我的servlet无法访问给定URL的Web应用程序数据库).

知道任何解决方案吗?(特别是我需要在servlet中执行此操作)如果您认为还有另一种从其他站点获取详细信息的最佳方法,请告诉我.

谢谢

html java jsp servlets web-scraping

4
推荐指数
2
解决办法
1万
查看次数

标签 统计

html ×1

java ×1

jsp ×1

servlets ×1

web-scraping ×1