grep 输出前一个 grep

Question

是否可以使用grep一个文件运行的多行输出作为模式，以便与另一个文件的后续第二次grep运行一起使用？

例子：

内容file2.txt

2 blue triangle
2 blue circle
3 blue triangle
2 red triangle
3 green circle
4 red square
2 orange circle
2 brown circle

现在，我正在寻找一个可以实现类似功能的命令

2 blue triangle
2 blue circle
3 blue triangle
2 red triangle
3 green circle
4 red square
2 orange circle
2 brown circle

这将找到其中的所有行均以运行 onfile2.txt生成的行之一开头，因此所需的结果是：grepfile1.txt

2 blue triangle
2 blue circle
2 orange circle

Answer 1

这是字面问题的答案。要获得可能更好地解决该任务的答案，请参阅awk下面“注释”中的解决方案。

\n

假设在中找到的模式file1.txt只能出现在中行的开头file2.txt，您可以使用该-f标志从文件中读取多个搜索模式，而不是在命令行上将它们声明为正则表达式。然后需要将该文件连接到第一次grep运行的输出。

\n

一种方法是进程替换：

\n

grep -F -w -f <(grep -w 2 file1.txt) file2.txt\n

该<( ... )构造使得括号中的命令的输出可用，就像它是一个文件一样。
该-F标志禁用完整的正则表达式搜索，是为了安全起见，以防第一次grep运行的输出可能包含在正则表达式上下文中具有特殊含义的字符。它还加快了匹配速度，因为文字字符串比较比正则表达式匹配更快。
该-w标志确保不会有部分匹配进入结果。grep如果的第一列file1.txt可以包含多位数字，例如，这对于第一次运行尤其可取12。

\n

更新

\n

正如 @St\xc3\xa9phane Chazelas 所指出的，该-f选项接受经常（但并非总是）实现的值-来引用程序的stdin，因此您也可以将其写为

\n

grep -w 2 file1.txt | grep -F -w -f - file2.txt\n

使用更容易识别的管道方法来读取另一个命令的输出。

\n

笔记

\n

\n

Answer 2

解决了：

$ grep 2 file1.txt | xargs -I{} grep {} file2.txt

2 blue triangle
2 blue circle
2 orange circle

请注意，“xargs”会因引号或反斜杠字符而阻塞，并删除前导空格。`grep` 也会阻塞以 `-` 开头的字符串（您需要 `--` 或 `-e`），并将它们视为正则表达式（您可能需要 `-F`）。所以 `grep 2 file1.txt | xargs -d '\n' -I {} grep -Fe {} file2.txt` （假设 GNU `xargs`），尽管这仍然非常低效，因为它在 `file1 的每个匹配行的 `grep` 上运行。 txt`，每个都完整读取`file2.txt`。 (6认同)