Ava*_*eka 2 command-line text-processing
如何在句子开头找到文件中重复单词的数量?例如
abc bdbdndnvd hddh hcjdhjc
dgdgd ghcdggcd abc hjdhcj
abc ghdsgcgdc cdghcgd dhgch
hshhj hcdhchd hdjchjd
Run Code Online (Sandbox Code Playgroud)
输出:
abc
Run Code Online (Sandbox Code Playgroud)
只对开始时整个文件中的重复单词感兴趣。如果其他地方的那个词不应该被计算在内。即在上面的例子abc
中重复两次。谁能建议我如何使用命令来做到这一点?我正在使用 Ubuntu 16.04。
使用cut
和uniq
cut -d" " -f1 | sort | uniq -d
Run Code Online (Sandbox Code Playgroud)
该cut
命令提取每行的第一个单词,并sort
结合uniq -d
打印仅打印重复的单词。