如何计算文件中每个单词的出现次数？

Question

我需要一个程序来计算单词的数量以及文件中每个单词的出现次数。

（我发现的大多数示例只计算单词总数。）

Answer 1

如果使用命令行（或脚本）没问题，那么有一百万个选项。就像使用 Perl（对于 Windows，您需要使用 Perl 安装ActivePerl或Cygwin）：

perl -0777 -lape's/\s+/\n/g' FILENAME | sort | uniq -c | sort -nr

@Sirex，我想你是对的：`cat FILENAME | sed s/' '/\\n/g | 排序 | uniq -c | sort -nr` 可能会给出相同的结果。 (2认同)

Answer 2

免费在线服务Wordcounter对任何给定文本正文中最常用的单词进行排名。使用它来查看您过度使用的单词，或者只是为了从文档中查找一些关键字。

Answer 3

这很容易。只需使用以下命令：

sort file.txt | uniq -c | sort -r