有没有可以对博客进行文本分析的软件?

Bri*_*man 8 blogging software-rec statistics word-count

在过去的 11 年中,我的公司希望为客户的 Wordpress 2 博客文章创建 PivotViewer 可视化。然而,要做到这一点,我们需要编辑有些随意、不完整且普遍较差的标签,以用作可排序的类别。我正在寻找一种工具来分析他们的博客条目并执行字数统计,让我们了解我们正在处理的内容。

理想情况下,它将具有所有这些功能:

  1. 单词黑名单(忽略)
  2. 词干提取
  3. 自定义同义词合并
  4. 计算所有用途
  5. 计算一个词出现的帖子数。

我本以为这种文本分析会非常普遍,但我一直无法在整个博客上找到任何软件来做这种事情。有没有可用的软件来做到这一点?

har*_*ymc 3

您正在寻找的软件可以有很多标题,例如“内容分析”“标签云”或“元标签”以及更多标题,例如“文本分析”和“文本挖掘”。

有很多用于这些目的的软件工具,包括免费的和商业的。

我没有使用此类工具的个人经验,但文本分析工具是一个很好的起点,其中列出了数十种此类工具,包括免费的和商业的。

另一个这样的列表是文本分析、文本挖掘和信息检索软件