小编Aks*_*Aks的帖子

solr 中基于向量的搜索

我正在尝试在 solr 中实现基于密集向量的搜索(当前使用版本 8.5.2)。我的要求是

  1. 将 solr 中每个文档的密集向量表示存储在名为 vectorForm 的字段中。
  2. 现在,当用户发出某些查询时,我也会将该查询转换为某种密集向量表示,现在我想从 solr 获取查询向量表示和 vectorForm 字段之间具有最高 dotProduct 值的前 100 个文档(为上面的每个文档存储) )在solr中。

我对此有几个问题是

  1. 应使用什么字段类型来定义 vectorForm 字段(具有多值整数的 docValues 在这里效果最好)?
  2. 如何有效地进行上述基于向量的检索?(请记住,延迟应尽可能低)

我读到 solr 有 dotProduct 和 cosinSimilarity 函数,但无法理解在我的情况下如何使用它,如果这就是解决方案,那么任何指向示例实现的链接都会有所帮助。

任何帮助或指导都会对我有巨大的帮助。

solr information-retrieval vector

6
推荐指数
2
解决办法
3808
查看次数

从EC2实例访问Amazon S3 Bucket

我在不同的区域有一个EC2实例和一个S3存储桶.存储桶包含我的EC2实例定期使用的一些文件.我想以编程方式下载我的EC2实例上的文件(使用python)

有没有办法做到这一点?

python amazon-s3 amazon-ec2 amazon-web-services amazon-iam

5
推荐指数
1
解决办法
4539
查看次数