识别重复字段并使用 awk 打印两者

Bob*_*Bob 3 bash duplicate awk shell-script

我有一个包含多列的文件，并想确定那些特定列值（第 3-6 列）已重复的文件。

以下代码查找重复项，但我想显示两个实例，而不仅仅是第二个。其他列值（cols 1、2 和 7+）在 2 行之间可能不同，因此我需要查看两个实例。

awk 'seen[$3, $4, $5, $6]++ == 1' filename

Run Code Online (Sandbox Code Playgroud)

uniq 是正确的工具：

uniq -D -f2 file

Run Code Online (Sandbox Code Playgroud)

在哪里：

-D - 打印所有重复项
-f2 - 避免比较前 2 个字段

编辑：如果不比较字段 7 及以上，则需要awk：

awk 'n=x[$3,$4,$5,$6]{print n"\n"$0;} {x[$3,$4,$5,$6]=$0;}' file

Run Code Online (Sandbox Code Playgroud)

x[]检查数组项（第 3-6 列）。如果已经设置，则运行该部分{...}（在同一语句中，n变量被设置为该数组项的值）
在括号中{...}：打印n变量和当前行$0。
然后我们将x[]下一次迭代的数组项设置为当前行内容，以供以后比较。

归档时间：	10 年，3 月前
查看次数：	15336 次
最近记录：	7 年，11 月前

GNU 超时的 POSIX 等价物？ 19

如何将 Bash 的进程替换与 HERE 文档结合起来？ 16

Bash 中是否可以将命令的输出作为实际的命令行来运行 12

如何杀死通过cron运行的shell脚本中的进程？ 5

在执行之前写一行而不写两次 4

OSX bash 终端自动完成 - 双选项卡上的奇怪行为 4

将 stderr 全局重定向到 /dev/null 后的不可见提示 3

awk 不行，但是过去做过吗？ 1

我如何使用： cat << EOF 0

bash $PS1 变量中的参数 0

如何使用 apt-get / aptitude 检查软件包版本？ 494

如何让 tail -f 显示彩色输出 298

sshd_config 中的选项`ServerAliveInterval` 和`ClientAliveInterval` 究竟做了什么？ 217

监视文件夹中是否有新文件的脚本？ 178

如何清理日志文件？ 178

命令行：如何将 PDF 文件旋转 90 度？ 111

进程替换和管道 108

如何测试我在终端中使用的外壳？ 96

如何删除目录中的所有文件？ 91

递归grep vs find / -type f -exec grep {} \; 哪个更有效/更快？ 82