在文件中查找重复的单词

Sye*_*aib 3 find duplicates

在Linux中,我有一个文本文件,有这样的重复单词

abc line 1
xyz zzz
123 456
abc end line
Run Code Online (Sandbox Code Playgroud)

现在我想只打印所有DUPLICATE字样(这是abc)怎么样?

Tho*_*hor 11

您可以使用标记化单词grep -wo并找到连续重复项uniq -d,添加-c以计算重复项的数量,例如:

grep -wo '[[:alnum:]]\+' infile | sort | uniq -cd
Run Code Online (Sandbox Code Playgroud)

输出:

2 abc
2 line
Run Code Online (Sandbox Code Playgroud)