什么是图书馆?有完整的实施吗?图书馆是如何使用的?它的网站在哪里?
python xml xpath dom nodes
我想抓取并将一些网页保存为HTML.比如说,爬进数百个热门网站,只需保存他们的前台和"关于"页面.
我已经查看了很多问题,但是没有从网页抓取或网页抓取问题中找到答案.
我应该使用什么库或工具来构建解决方案?或者甚至有一些现有的工具可以处理这个?
python java web-crawler web-scraping web-mining
python ×2
dom ×1
java ×1
nodes ×1
web-crawler ×1
web-mining ×1
web-scraping ×1
xml ×1
xpath ×1