小编Yuz*_*uze的帖子

索引Wikipedia转储到elasticsearch获取XML文档结构必须在同一实体错误中开始和结束

我想将维基百科索引到elasticsearch.

我尝试了stream2es + elasticsearch 2.0.0和Wikipedia River Plugin 2.6.0 + elasticsearch 1.6.0来索引最新的维基百科转储https://dumps.wikimedia.org/enwiki/20151102/enwiki-20151102-pages-articles-multistream.xml .bz2.

但是两者都得到了相同的错误消息:

XML document structures must start and end within the same entity.
Run Code Online (Sandbox Code Playgroud)

xml wikipedia elasticsearch

4
推荐指数
1
解决办法
1191
查看次数

标签 统计

elasticsearch ×1

wikipedia ×1

xml ×1