计算趋势主题

Bri*_*ian 5 php mysql

假设我正在根据各种标准从twitter收集推文,并将这些推文存储在本地mysql数据库中.我希望能够使用计算机热门话题,比如twitter,可以是1-3个单词的长度.

是否有可能编写一个脚本来做这样的PHP和mysql?

我已经找到了在你能够获得术语计数后如何计算哪些术语"热"的回答,但我坚持第一部分.如何将数据存储在数据库中,如何计算数据库中1-3个字长的术语频率?

Dom*_*nik 1

首先将您的推文分解为单个单词标记并计算每个单词的出现次数怎么样?一旦获得它们,您就可以分解所有两个单词标记,计算出现的次数,最后对所有三个单词标记执行相同的操作。

您可能还想添加某种您不想计算的单词词典