在Linux中,我有一个文本文件,有这样的重复单词
abc line 1
xyz zzz
123 456
abc end line
Run Code Online (Sandbox Code Playgroud)
现在我想只打印所有DUPLICATE字样(这是abc)怎么样?
Tho*_*hor 11
您可以使用标记化单词grep -wo并找到连续重复项uniq -d,添加-c以计算重复项的数量,例如:
grep -wo '[[:alnum:]]\+' infile | sort | uniq -cd
Run Code Online (Sandbox Code Playgroud)
输出:
2 abc
2 line
Run Code Online (Sandbox Code Playgroud)