您之前使用elasticsearch索引过nutch抓取结果吗?

nei*_*ldf 8 lucene full-text-search web-crawler nutch elasticsearch

有没有人有幸为nutch编写自定义索引器以使用elasticsearch索引爬网结果?或者你知道任何已经存在的东西吗?

Mat*_*ber 10

我写了一个模拟Solr api的ElasticSearch插件.使用此插件和标准Nutch Solr索引器,您可以轻松地将已爬网数据发送到ElasticSearch.插件和如何在Nutch上使用它的示例可以在GitHub上找到:

https://github.com/mattweber/elasticsearch-mocksolrplugin


Jul*_*che 2

还没有这样做,但这绝对是可行的,但需要搭载 SOLR 代码(src/java/org/apache/nutch/indexer/solr)并将其适应 ElasticSearch。顺便说一句,这对 Nutch 来说是一个很好的贡献