如何删除包含三个重复字段的文本文件中的行(字符串按空格分隔)

spe*_*ong 0 duplicate text-processing

我有一个长文本文件如下(从下载链接和下载的文件名生成):

file01 48976 5873987 48976 48976 thdshiesde
file02 29876 589845637 29876 29876 uyjedrty 54
file03 38745 58934 99432 38745 hytug 48
Run Code Online (Sandbox Code Playgroud)

等等。

我想删除重复字段 2、4 和 5 的行。

从上面的例子我想生产:

file03 38745 58934 99432 38745 hytug 48
Run Code Online (Sandbox Code Playgroud)

等等。

(前两行包含删除所需的必要重复字段,而第三行不包含,因此保留。)

有什么建议?

Ste*_*itt 5

AWK 很简单地做到了这一点:

awk '!($2 == $4 && $4 == $5)'
Run Code Online (Sandbox Code Playgroud)