击.从多个文件中获取交集

Jon*_*ono 13 bash shell awk command-line grep

那么让我解释一下这个:

我有一个名为tags的目录,每个标签都有一个文件,如:

tags/
    t1
    t2
    t3

Run Code Online (Sandbox Code Playgroud)

在每个标记文件中都有如下结构:

<inode> <filename> <filepath>

Run Code Online (Sandbox Code Playgroud)

当然,每个标记文件都有一个包含该标记的许多文件的列表(但文件只能出现在一个标记文件中一次).并且文件可以在多个标签文件中.

我想要做的就是调用命令

tags <t1> <t2>

Run Code Online (Sandbox Code Playgroud)

让它以一种很好的方式列出标记为t1和t2的文件.

我现在的计划是制作临时文件.基本上将t1的整个文件输出到其中.然后在t2中遍历每一行并对文件执行awk.并继续这样做.

但我想知道是否有人有任何其他方式.我对awk,grep等不太熟悉.

您可以尝试使用comm实用程序

comm -12 <t1> <t2>

Run Code Online (Sandbox Code Playgroud)

comm 使用followinng选项的适当组合可以对文件内容的不同设置操作有用.

   -1     suppress column 1 (lines unique to FILE1)

   -2     suppress column 2 (lines unique to FILE2)

   -3     suppress column 3 (lines that appear in both files)

Run Code Online (Sandbox Code Playgroud)

这假定<t1>并<t2>排序.如果没有,他们应该首先排序sort

使用 Linux 十多年后，TIL `comm`。谢谢你！ (2认同)
@AdamLiss欢迎你.我从你的解决方案中学习了`uniq`的`-d`选项.谢谢你的回报.归功于SO知识共享.干杯! (2认同)

你能用吗？

sort t1 t2 | uniq -d

Run Code Online (Sandbox Code Playgroud)

这将合并两个文件,对它们进行排序,然后仅显示多次出现的行:即两个文件中出现的行.

这假定每个文件中不包含重复项,并且inode在特定文件的所有结构中都是相同的.

归档时间：	12 年，3 月前
查看次数：	8566 次
最近记录：	6 年，8 月前

什么是$？shell脚本中的(美元问号)变量？ 238

如何对目录中的所有文件执行grep操作 185

是否有良好的Java库可以帮助构建命令行应用程序？ 40

在Clojure中编写一个惰性的,功能性的,交互式的命令行应用程序 18

为什么 Bash `(())` 在 `[[]]` 中不起作用？ 15

Bash Centos7“哪个”命令 8

剥离错误或没有错误 3

sed regex从方法声明中提取选择器(Obj-C) 3

grep:匹配文字"+" 2

在命令行上为jMeter增加内存 2

在Git中只提交文件的一部分 2629

如何测试私有函数或具有私有方法,字段或内部类的类？ 2593

如何在JavaScript中检查"undefined"？ 2294

一次捕获多个异常？ 2015

常规演员与static_cast与dynamic_cast 1661

除了XHTML自包含标记之外,RegEx匹配开放标记 1323

适用于PDF文件的MIME媒体类型 1229

在现代Python中声明自定义异常的正确方法？ 1176

如何从JavaScript对象中删除密钥？ 1171

命名类 - 如何避免将所有内容称为"<WhatEver> Manager"？ 1147