相关疑难解决方法(0)

为非英语字符启用soundex/metaphone

过去几天我一直在研究soundex,metaphone和其他字符串搜索技术,据我所知,这两种算法在处理音译到英语的非英语单词时效果很好.

然而,我的要求是这样的搜索工作在原始的,非音译语言,容纳字母表,如德语,挪威语,甚至Cyrilic字母表.

有没有能够完全处理这些字母的搜索算法?或者我最好使用第三方全文搜索库,如Lucene?因此,问题就变成了"Lucene处理非英文字母吗?"

lucene algorithm search soundex metaphone

14
推荐指数
1
解决办法
8265
查看次数

Lucene模糊搜索客户名称和部分地址

我正在通过所有现有问题的帖子,但无法得到一些相关的东西.

我有人数名,姓,地址1,地址2,国家代码,出生日期的数百万条记录的文件 - 我想每天检查我的客户名单(我的客户名单也每天更新和文件也每天更新).

对于名字和姓氏,我想模糊匹配(可能是lucene fuzzyquery/levenshtein距离90%匹配),对于剩余字段国家和出生日期我想要完全匹配.

我是Lucene的新手,但通过查看帖子的数量,看起来很可能.

我的问题是:

  • 我该如何索引输入文件?我需要在FN,LN,country,DOB的组合上构建索引并使用索引进行搜索
  • 我怎么能在这里使用Lucene的模糊查询?

还有其他方法可以实现吗?

lucene fuzzy-search

7
推荐指数
1
解决办法
5813
查看次数

训练solr以识别昵称或名称变体

我很确定solr可以设置为在搜索期间识别同义词.我想知道是否可以用昵称做同样的事情 - 所以例如搜索"Robert"会将"Bob"记录在其中.

solr names synonym

1
推荐指数
1
解决办法
1110
查看次数

标签 统计

lucene ×2

algorithm ×1

fuzzy-search ×1

metaphone ×1

names ×1

search ×1

solr ×1

soundex ×1

synonym ×1