删除 Linux 中的非重复行

qlw*_*wik 4 linux awk text-manipulation uniq

如何使用任何 linux 程序链接 sed、awk 或任何其他程序从文本文件中删除非重复行？

例子：

abc
bbc
abc
bbc
ccc
bbc

Run Code Online (Sandbox Code Playgroud)

结果：

abc
bbc
abc
bbc
bbc

Run Code Online (Sandbox Code Playgroud)

第二个列表已删除 ccc，因为它没有重复的行。

是否也可以删除只有 2 个重复行的非重复 AND 行，并留下那些有超过 2 个重复行的行？

其他人发布的解决方案在我的 Debian Jessie 上不起作用：他们保留任何重复行的单个副本，而我对 OP 的理解是保留重复行的所有副本。如果我已经正确理解了 OP，那么...

以下命令
```
awk '!seen[$0]++' file
```
Run Code Online (Sandbox Code Playgroud)
删除所有重复的行。
以下命令
```
awk 'seen[$0]++' file 
```
Run Code Online (Sandbox Code Playgroud)
输出所有副本，但不输出原始副本：即，如果一行出现n次，则输出该行n-1次。
然后命令
```
awk 'seen[$0]++' file > temp && awk '!seen[$0]++' file >> temp
```
Run Code Online (Sandbox Code Playgroud)
解决你的问题。这些行不是按原始顺序排列的。
如果你想要有两个或更多重复的行，你现在可以迭代上面的：
```
awk 'seen[$0]++' file | awk 'seen[$0]++' > temp
```
Run Code Online (Sandbox Code Playgroud)
保留n >1 个重复行的n-2 个副本。现在
```
awk '!seen[$0]++' temp > temp1 
```
Run Code Online (Sandbox Code Playgroud)
从临时文件中删除所有重复的行，您现在可以获得您想要的内容（即只有n>1重复的行）如下：
```
cat temp1 >> temp; cat temp1 >> temp
```
Run Code Online (Sandbox Code Playgroud)
如果您需要对出现N次或更多次的行执行此操作，请执行以下命令
```
  awk 'seen[$0]++ && seen[$0] > N' file 
```
Run Code Online (Sandbox Code Playgroud)
比将命令链接N次更简单awk 'seen[$0]++' file。

您可以为此使用sort&命令。uniq

如果你的数据在 abc.txt 文件中，那么；

cat abc.txt |sort|uniq -d

Run Code Online (Sandbox Code Playgroud)

输出将是；

abc 
bbc

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，1 月前
查看次数：	5133 次
最近记录：	4 年，5 月前

开源命令行字幕转换器 37

命令来查找二进制文件的源包？ 36

主机从休眠状态恢复后，如何在作为虚拟来宾运行的 linux 中正确同步时间？ 19

linux中命令选项的顺序重要吗？ 16

究竟是什么决定了后台作业是在退出 shell 时被杀死还是被杀死？ 16

如何计算找到的文件的总行数？ 12

绑定两个wifi适配器 11

从 Debian 软件包安装启用 systemd.service 的首选/惯用方法 7

在 Linux 中从 .XML 文件中获取价值 5

Linux rpm -Uvh（错误：无法在 /var/lib/rpm/__db.000 上创建事务锁）？ 2

确定 Firefox 中的哪个选项卡正在使用 CPU 资源？ 309

有没有办法在 GitHub 上编辑提交消息？ 144

yum、apt-get、rpm、./configure && make install 有什么区别？ 141

在 Windows 命令提示符中是否有一个快捷命令可以像在 Linux 中那样进入当前用户的主目录？ 134

如何在 MacBook Pro 上输入 Home/End/PageUp/PageDown？ 131

如何从 Dropbox 同步中排除文件（不是文件夹）？ 114

通过中间主机的 scp 文件 111

我必须跳过哪些 Windows 7/8/8.1 更新 (KB) 以避免 Windows 10 升级 - 和唠叨 -？ 104

有没有办法伪造双（第二）显示器 101

Google Chrome DevTools 解析 SourceMap 失败：chrome-extension 100