解析减去停用词的搜索字符串

Poo*_*oli 2 sql-server full-text-search

我的任务是在一个新应用程序上创建一个“google-esque”搜索机制,但我在存储过程中遇到了一些障碍,该存储过程旨在在 SQL Server 数据库中运行实际搜索。

本质上,该过程是在从用户输入中获取的字符串中传递的,然后使用以下替换将其解析为 contains 语句。

SELECT @SearchString = '"'+ REPLACE(REPLACE(@SearchKeyword,'"',''), ' ', '" AND "') +'"'
Run Code Online (Sandbox Code Playgroud)

除非 @SearchKeyword 变量包含停止词,否则这种方法效果很好,此时,将其作为链式 AND 语句的一部分包含在内会导致找不到结果的错误。

(例如,使用“Something Somewhere”搜索用户会返回正确的结果集,但 Something of Somewhere 由于未包含在全文索引目录中而不会返回任何内容)。

我知道我可以采取从轨道上删除所有条目的方法,从停止列表中删除所有条目,但理想情况下,我想简单地修改原始替换,以不链接到停止列表中包含的 and 语句单词。

不幸的是,这让我知识匮乏,我无法找到从哪里提取这些信息以便将其用于替换目的。

我是否走在正确的轨道上,或者删除停止列表(虽然很混乱)是最好的解决方案?

Poo*_*oli 5

这个问题已经找到答案了,所以留在这里供参考。

您可以通过将文本传递到 sys.dm_fts_parser 来识别输入中的哪些单词是默认停用词

DECLARE @Keywords VARCHAR(200)
SET @Keywords = '"Web Designer"'

SELECT * 
FROM sys.dm_fts_parser(@Keywords, 1033, 0, 0) 
WHERE special_term <> 'Noise Word' AND display_term IS NOT NULL
Run Code Online (Sandbox Code Playgroud)