如何通过命令查找文件中重复单词的数量？

Question

如何在句子开头找到文件中重复单词的数量？例如

abc bdbdndnvd hddh hcjdhjc  
dgdgd ghcdggcd abc hjdhcj 
abc ghdsgcgdc cdghcgd dhgch 
hshhj hcdhchd hdjchjd

输出：

abc

只对开始时整个文件中的重复单词感兴趣。如果其他地方的那个词不应该被计算在内。即在上面的例子abc中重复两次。谁能建议我如何使用命令来做到这一点？我正在使用 Ubuntu 16.04。

Answer 1

使用cut和uniq

cut -d" " -f1 | sort | uniq -d

该cut命令提取每行的第一个单词，并sort结合uniq -d打印仅打印重复的单词。