如何通过命令查找文件中重复单词的数量?

Ava*_*eka 2 command-line text-processing

如何在句子开头找到文件中重复单词的数量?例如

abc bdbdndnvd hddh hcjdhjc  
dgdgd ghcdggcd abc hjdhcj 
abc ghdsgcgdc cdghcgd dhgch 
hshhj hcdhchd hdjchjd 
Run Code Online (Sandbox Code Playgroud)

输出:

abc 
Run Code Online (Sandbox Code Playgroud)

只对开始时整个文件中的重复单词感兴趣。如果其他地方的那个词不应该被计算在内。即在上面的例子abc中重复两次。谁能建议我如何使用命令来做到这一点?我正在使用 Ubuntu 16.04。

Way*_*Yux 5

使用cutuniq

cut -d" " -f1 | sort | uniq -d
Run Code Online (Sandbox Code Playgroud)

cut命令提取每行的第一个单词,并sort结合uniq -d打印仅打印重复的单词。