我用Nutch 2.1抓取了一个URL,然后我想在更新后重新抓取页面.我怎样才能做到这一点?我如何知道页面已更新?
apache lucene solr web-crawler nutch
apache ×1
lucene ×1
nutch ×1
solr ×1
web-crawler ×1