小编Tho*_*ars的帖子

我正在尝试获取列中出现最频繁的单词的列表。

SELECT
  word,
  sum(nentry) AS nentry
FROM ts_stat(
  $$
    SELECT to_tsvector('simple', body)
    FROM document
  $$
)
GROUP BY word

这工作得很好，但问题是文档包含法语和英语单词。如果我使用英语词典作为停用词，我得到的最常见的词是，而当我使用法语词典时pour也是如此。the这两个词显然是我想排除的。

有没有办法创建一个使用两个不同词典作为停用词的配置？

4
推荐指数

1
解决办法

340
查看次数

小编Tho_ars的帖子