为什么不通过在elasticsearch中设置刷新间隔来提高性能

woo*_*eol 3 indexing performance bulkinsert elasticsearch

我看了关于提高索引性能的网站备忘录.这是网站链接

此链接指示我如何提高性能.但是,当我习惯使用elasticsearch-py批量生成python api时,它并没有提高elasticsearch中的索引速度.

即使所有配置更改都不会影响批量索引性能.

我使用并行进程或线程.每秒最大平均30000索引.

我有什么错?

主节点:1个数据节点:5个包括主节点CPU:Intel(R)Xeon(R)CPU E5645 @ 2.40GHz RAM:32G

ES_HEAPSIZE:10G

谢谢

Duc*_*ong 5

它实际上大大提高了性能(超过我50%).您只需要禁用refresh_interval(完成索引数据后再次启用它)

curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "-1"  }}'

#index data......

curl -XPUT "http://localhost:9200/$INDEX_NAME/_settings" -d '{ "index" : { "refresh_interval" : "1s"  }}'
Run Code Online (Sandbox Code Playgroud)