标签: statistical-semantics

可以使用全文索引来查找最接近的匹配字符串吗?统计语义在全文索引中的作用

我正在寻找SQL Server 2016全文索引,它们很棒,可以搜索查找包含字符串的多个单词

当我尝试撰写全文索引时,它显示Statistical Semantics为复选框.统计语义有什么作用?

而且,我想找到你的意思是查询

例如,假设我有一个记录house.用户类型hause

我可以使用全文索引hause作为最接近的匹配返回并显示用户你的意思是房子有效吗?谢谢

我尝试过soundex,但它产生的结果非常糟糕

它返回了许多无关的词

由于我的数据库中有如此多的记录,我需要非常快的结果,我需要SQL服务器本身支持的东西

有任何想法吗?使用索引实现这种事情的任何方法?

我知道有多种算法,但它们对我来说在线使用效率不高.我的意思是计算每个记录之间的编辑距离.它们可以用于离线项目,但我需要在一个在线词典中提高效率,这里会不断有数千个请求.

我已经有了一个计划.在数据库中存储未找到的结果并离线计算最接近的匹配.并将它们用作缓存.但是,我想知道任何可能存在的在线/实时解决方案?考虑将有超过100m的nvarchar记录

sql sql-server full-text-search full-text-indexing statistical-semantics

6
推荐指数
1
解决办法
712
查看次数