我正在尝试获取列中出现最频繁的单词的列表。
SELECT
word,
sum(nentry) AS nentry
FROM ts_stat(
$$
SELECT to_tsvector('simple', body)
FROM document
$$
)
GROUP BY word
Run Code Online (Sandbox Code Playgroud)
这工作得很好,但问题是文档包含法语和英语单词。如果我使用英语词典作为停用词,我得到的最常见的词是,而当我使用法语词典时pour也是如此。the这两个词显然是我想排除的。
有没有办法创建一个使用两个不同词典作为停用词的配置?