比较两个文件的单列

Question

比较两个文件的单列

我有两个文件,每个文件有两个用空格分隔的列.

我想在两个文件中找到第2列不相同的行,并将它们输出到第三个文件.

档案A:

1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
2 BBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
3 CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
4 DDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
5 EEEEEEEEEEEEEEEEEEEEEEEEEEEEEE
6 FFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
7 GGGGGGGGGGGGGGGGGGGGGGGGGGGGGG
8 HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH

Run Code Online (Sandbox Code Playgroud)

文件B:

1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
2 BBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
3 CCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
4 DDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
5 WWWWWWWWWWWWWWWWWWWWWWWWWWWWWW
6 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
7 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
8 ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ
9 EEEEEEEEEEEEEEEEEEEEEEEEEEEEEE
10 FFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
11 GGGGGGGGGGGGGGGGGGGGGGGGGGGGGG
12 HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH

Run Code Online (Sandbox Code Playgroud)

期望的输出:

5 WWWWWWWWWWWWWWWWWWWWWWWWWWWWWW
6 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
7 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
8 ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ

Run Code Online (Sandbox Code Playgroud)

我认为最简单的方法是grep从文件B中的文件A开始,但我是bash的新手,无法弄清楚下一步.任何帮助是极大的赞赏!

Answer 1

fed*_*qui 5

你可以使用awk这个:

$ awk 'FNR==NR {a[$1]=$2; next} $1 in a && a[$1] != $2' fileA fileB
5 WWWWWWWWWWWWWWWWWWWWWWWWWWWWWW
6 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
7 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
8 ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ

Run Code Online (Sandbox Code Playgroud)

它循环遍历存储数组中值的第一个文件a[1st col] = 2nd col.然后,它循环遍历第二个文件并打印匹配这些条件的那些行:

第一列出现在第一个文件中.
第二列值与第一个文件中的值不同.

要将其存储到新文件中,只需将命令重定向到文件:

awk 'FNR==NR {a[$1]=$2; next} $1 in a && a[$1] != $2' fileA fileB > fileC
                                                                  ^^^^^^^

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，11 月前
查看次数：	500 次
最近记录：	10 年，11 月前