小编Joh*_*rty的帖子

elasticsearch多词重叠同义词

我开发了一个职称词库,我试图把它变成一种与Elasticsearch一起使用的格式.

我的问题:多字重叠同义词

我正在尝试确定多字重叠同义词的解决方案.当我处理作业名称为"信息安全工程师"的作业时,我希望它将"信息安全"和"安全工程师"添加到索引中.

以前,我在索引中包含了信息安全的同义词,但我发现它会将"信息安全工程师"编入索引为"信息安全",它不会将"安全工程师"编入索引.因此,我从索引中删除了诸如"信息安全"之类的同义词集.

现在,我正在寻找一种在索引中包含信息安全同义词的方法.

一些选项可供选择:

1.)我可以添加"信息安全工程师"作为"安全工程师"的同义词,然后将"安全工程师"也编入索引为"信息安全".我可以将"信息安全"同义词添加到分析器和搜索分析器中.

索引时的示例:

"synonyms" : [
    "security engineer, info security engineer => security_engineer, information_security",
    "information security, info security => information_security"
]
Run Code Online (Sandbox Code Playgroud)

搜索时的示例:

"synonyms" : [
    "security engineer, info security engineer => security_engineer, information_security",
    "information security, info security => information_security"
]
Run Code Online (Sandbox Code Playgroud)

确保"安全工程师"同义词包含所有"信息安全"同义词在整个叙词表中难以实现.

2.)我可以将"安全工程师"也编入索引为"信息安全".我会将"Information Security"的同义词添加到search_analyzer中,因此它会搜索"Information Security"一词.

索引时的示例:

"synonyms" : [
    "security engineer => security_engineer, information_security"
]
Run Code Online (Sandbox Code Playgroud)

搜索时的示例:

"synonyms" : [
    "security engineer => security_engineer",
    "information security, info security => information_security"
]
Run Code Online (Sandbox Code Playgroud)

当有人搜索"信息安全"作业时,它会返回在索引时设置为包含"信息安全"的任何作业.但是,在标题中具有诸如"信息安全"之类的短语但在索引时没有映射到任何信息安全职称的作业将不会包含在"信息安全"的搜索中.

3.)我可以将"信息安全性"添加到search_analyzer并将其扩展为"安全工程师"和任何其他信息安全工作. …

synonym thesaurus elasticsearch

5
推荐指数
0
解决办法
303
查看次数

标签 统计

elasticsearch ×1

synonym ×1

thesaurus ×1