小编Use*_*425的帖子

从字符串中返回前 100 个单词

不确定这是否可行,但我想知道是否有任何方法可以使用 PostgreSQL 从包含不同长度的字符串的数据库列中返回前 100 个最常出现的单词?

该表包含约 250k 行,每行包含message许多其他元数据。那么,有没有办法筛选每一行中的每个单词,获取它出现的总次数并将其与同一列中所有其他单词的计数进行比较以返回前 100 个?

如果更容易,可以删除元数据以仅保留包含推文的列。

理想情况下,我希望能够执行该网站所做的工作以提供相同的输出,但只有更多的记录。

postgresql full-text-search

5
推荐指数
1
解决办法
3405
查看次数

标签 统计

full-text-search ×1

postgresql ×1