Abh*_*hri 5 metaphone phonetics elasticsearch
我在 Elasticsearch 中使用了Metaphone和soundex编码器以及“Phonetic Token Filter”。
变音位对于英语单词很有用。
Soundex适用于英语、印地语以及许多其他语言。
我想知道哪些编码器最适合印地语以及其他印度语言(如果可能的话)?
由于Elasticsearch 网站上没有列出我们应该选择哪种语言的编码器。
还请告诉我您已经使用过哪些编码器以及用于哪种语言。
语音编码器是根据单词发音对单词进行索引的算法。
\n\n维基百科上有对此的解释
\n\n\n\n\n\n
\n- Metaphone、Double Metaphone 和 Metaphone 3:适用于大多数英语单词,而不仅仅是名称。变音位算法是许多流行拼写检查器的基础。Double Metaphone\n 语音编码算法是该算法的第二代\n。
\n- Soundex:开发用于对姓氏进行编码以供人口普查使用。Soundex 代码是由一个单个字母后跟三个数字组成的四个字符的字符串。
\n- Daitch\xe2\x80\x93Mokotoff Soundex:这是 Soundex 的改进,旨在更好地匹配斯拉夫语和日耳曼语起源的姓氏。\n Daitch\xe2\x80\x93Mokotoff Soundex 代码是由六个数字\n 数字组成的字符串。
\n- 科隆语音:这与 Soundex 类似,但更适合德语单词。
\n- 纽约州识别和情报系统(NYSIIS):将相似的音素映射到同一个字母。结果\n是一个读者无需解码即可发音的字符串。
\n- 西部航空于 1977 年开发的匹配评级方法:该算法具有编码和范围比较技术。
\n- Caverphone:创建用于协助 19 世纪末和 20 世纪初选民名册之间的数据匹配,针对新西兰部分地区的口音进行了优化
\n
参考文献:\n 上述算法及其子类型的详细信息可在下面的维基百科页面中找到\n 1. https://en.wikipedia.org/wiki/Phonetic_algorithm
\n\n其中,SoundEx 最适合印度语言\n您可以查看以下资源以了解相同\n1. 印度语言的语音搜索\n2. https://thottingal.in/blog/2009/07/26/indicsoundex/
\n| 归档时间: |
|
| 查看次数: |
1444 次 |
| 最近记录: |