pre*_*rem 4 lucene hdfs elasticsearch
是否可以在Elasticsearch集群中存储图像?如果是,那么有关于工作流程的资源吗?我检查了以下链接:https://github.com/kzwang/elasticsearch-image
由于我们必须处理大型图像文件(超过500GB),我们计划使用HDFS.
sau*_*hts 10
在Elasticsearch中存储整个图像将不是非常有用,因为如果图像被缩放/裁剪然后用作查询,则会产生不正确的结果.您需要什么取决于您想要为这些图像编制索引的原因.
在我的情况下,我需要找到一些缩放或裁剪后的图像,在我的数据库中是否匹配.我正在提取图像的局部描述符(SIFT/SURF)并使用它们来构建Elasticsearch索引.这将减小图像索引大小,而不是存储整个图像,仅存储少量特征.我现在将所有这些图像存储在S3上,Elasticsearch将存储这些图像的ID以及从中提取的特征.
关于elasticsearch-image:这个插件在一段时间内没有更新,最近的问题回复来自去年.此插件将LIRE与Elasticsearch 集成,其中LIRE提供多图像指纹提取器的功能.
可能的解决方案:
集成库OpenCv(用于计算图像的特征向量)和Elasticsearch,并使用这些图像特征构建自己的索引,而不是存储整个图像.对于产品架构,您可以在此处获得一些提示.
使用旧版本的Elasticsearch以及elasticsearch-image的兼容版本.
升级elasticsearch-image以使用最新版本的Elasticsearch.
您还可以将SOLR与LireSolr插件一起使用,以与LireSolr库集成.