Tim*_*ote 12
sort a b | uniq -u
Run Code Online (Sandbox Code Playgroud)
如果你想要A和B之间相同的线,你可以使用 uniq -d
sort a b | uniq -d
Run Code Online (Sandbox Code Playgroud)
这当然假定A和B中的数据完全相同.数据集中不能有任何丢失空格或制表符.如果有,你就必须清理数据用sed,tr或awk第一.
编辑
作为彼得.O指出,如果文件中发生了完全相同的重复,这将失败a.如果这是一个问题,您可以通过执行以下操作来解决此问题:
sort <(sort -u a) b | uniq -u
Run Code Online (Sandbox Code Playgroud)
有一个实用程序叫做comm用于这个:
comm -23 A B > C
Run Code Online (Sandbox Code Playgroud)
其中的-2意思是"拒绝文件B特有的行"(你说没有任何行),-3意思是"拒绝两个文件共有的行".
@BartonChittenden提出了一个很好的观点:
comm -23 <(sort A) <(sort B) > C
Run Code Online (Sandbox Code Playgroud)