如何使Nutch 2.3.1与ElasticSearch 5.3.2一起使用?

Won*_*ane 1 nutch elasticsearch

我已经在Ubuntu 16.04上启动并运行了ElasticSearch 5.3.2,并希望使用Nutch来爬网网站。我已经编译了Nutch 2.3.1,并成功地抓取了它,但是当我将其索引到Elastic中时,会出现错误。

命令:

bin / nutch索引-all

输出:

误差

在/var/logs/elasticsearch/elasticsearch.log文件中,我收到以下消息:

elasticsearch日志文件

有谁知道此错误的含义以及如何解决此问题?谢谢

Val*_*Val 5

我不认为Nutch 2.3.1已经可以使用普通的ES Java插件与ES 5.3.2一起使用。据我所知,当前的Nutch版本刚刚升级到ES 2.3.3

但是,您可以indexer-elastic-rest使用Jest 2.0.3库使用在HTTP级别与ES交互的插件。

您需要做的就是配置所有 在Nutch配置文件中 “ elasticsearch rest”属性

  • 谢谢@val。我最终放弃了ES 5.3.2,安装了1.7.2,现在我有了Nutch 2.3.1可以很好地爬行和索引到ES中了。我将看看是否可以在ES 2.3.3中使用它。 (2认同)