使用 PHP 在文本正文中查找 3-8 个单词的常用短语

owi*_*900 4 php data-mining text-mining

我正在寻找一种使用 PHP 在文本正文中查找常用短语的方法。如果在 php 中不可能,我会对其他可以帮助我完成此任务的网络语言感兴趣。

内存或速度都不是问题。

现在,我可以轻松找到关键字,但不知道如何搜索短语。

Cor*_*Xii 5

我在这里编写了一个 PHP 脚本来完成这个任务。它首先将源文本拆分为单词数组及其出现次数。然后,它会计算具有指定参数的这些单词的常见序列。这是旧代码并且没有注释,但也许您会发现它很有用。