始终在grep中包含第一行

Question

我经常在第一行使用列名grep CSV文件.因此,我希望grep的输出始终包含第一行(获取列名称)以及与grep模式匹配的任何行.做这个的最好方式是什么？

Answer 1

sed '1p;/pattern/!d' input.txt

awk 'NR==1 || /pattern/' input.txt

grep1() { awk -v pattern="${1:?pattern is empty}" 'NR==1 || $0~pattern' "${2:?filename is empty}"; }

Answer 2

另外一个选择：

$ cat data.csv | (read line; echo "$line"; grep SEARCH_TERM)

例子：

$ echo "title\nvalue1\nvalue2\nvalue3" | (read line; echo "$line"; grep value2)

输出：

title
value2

Answer 3

您可以为列名之一包含备用模式匹配。如果列被称为COL，那么这将起作用：

$ grep -E 'COL|pattern' file.csv

Answer 4

grep并没有真正的行号概念,但是awk确实如此,所以这里输出行的示例包含"Incoming" - 以及第一行,无论它是什么:

awk 'NR == 1 || /Incoming/' foo.csv

你可以制作一个脚本(有点过分但是).我创建了一个文件,grep + 1,并将其放入其中:

#!/bin/sh
pattern="$1" ; shift
exec awk 'NR == 1 || /'"$pattern"'/' "$@"

现在可以:

./grep+1 Incoming

编辑:删除了"{print;}",这是awk的默认操作.

你好，亚历克斯——我喜欢脚本的想法，但可能会稍微修改它以实际使用 grep 而不是 awk 以便可以使用 grep 的其他命令行参数：`read; printf '%s\n' "$REPLY"; grep "$@"`。这种方法的主要问题是，如果 args 包含文件名，则需要将它们解析出来以进行本地处理。 (2认同)

Answer 5

您可以使用sed而不是grep这样做:

sed -n -e '1p' -e '/pattern/p' < $FILE

这将打印第一行两次,但是,如果它恰好包含该模式.

-n告诉我sed不要默认打印每一行.
-e '1p'打印第一行.
-e '/pattern/p'打印与模式匹配的每一行.