Proton文档说http://docs.vespa.ai/documentation/proton.html所有数据都将存储在$ VESPA_HOME/var/db/vespa/search /
我们从yum安装vespa
echo "Installing Vespa"
yum -y install yum-utils epel-release
yum-config-manager --add-repo https://copr.fedorainfracloud.org/coprs/g/vespa/vespa/repo/epel-7/group_vespa-vespa-epel-7.repo
yum -y install vespa bind-utils git
Run Code Online (Sandbox Code Playgroud)
它将env变量VESPA_HOME设置为"/ opt/vespa"
我们如何阻止/ opt/vespa中的数据?我们需要将VESPA_HOME设置为"/ mnt1/vespa"
试过,手动设置并通过yum安装后; 不起作用.
我们还有其他选择来配置"/ opt/vespa"之外的数据目录吗?
有没有办法从同一个集群的所有节点中删除索引(其文档)?
现在,我正在遵循这个命令:
$ /opt/vespa/bin/vespa-stop-services && /opt/vespa/bin/vespa-remove-index -force && /opt/vespa/bin/vespa-start-services
Run Code Online (Sandbox Code Playgroud)
但它只从当前节点中删除文档,我不得不在集群的每个节点上运行它.
我们在 AWS EC2 centos 实例上安装 Vespa 时遇到一些问题,我们使用以下步骤进行安装。
在启动 Vespa 配置服务器时,我们遇到以下错误-
不会启动配置服务器,主机不是 VESPA_CONFIGSERVE 的一部分.....
我在处理元素相似性方面的多值查询项和字段时遇到了麻烦。例如,如果我们有一个像这样的字符串数组:
field colors type array<string>
# That might have several items like: "blue", "black and purple", "green", "yellow", etc
Run Code Online (Sandbox Code Playgroud)
我希望使用项目列表进行查询:
"blue" (weight 0.5), "black" (weight 1.0)
Run Code Online (Sandbox Code Playgroud)
有没有办法执行加权列表相似性,可能看起来像:weight * elementSimilarity(颜色为蓝色)+ weight * elementSimilarity(颜色为黑色)?
我尝试了多种功能,包括 nativeRank,但根据查询数组的长度以及字段数组,我得到了不一致的结果。由于我也希望能够处理拼写错误,“blu”应该与“blue”有很高的匹配度——因此我更喜欢 elementSimilarity。我想我已经尝试了 vespa 中的大部分排名功能,但我还没有找到更好的方法来处理这个用例。
任何指导将不胜感激!谢谢!
编辑:只是详细说明,也许 Vespa 中对我最大的限制是如何在查询中处理数组。我非常想做类似的事情:
expression {
foreach(terms,N,query(colors,N).weight*elementSimilarity(query(colors,N)),true,sum)
}
Run Code Online (Sandbox Code Playgroud) vespa ×5