为什么我不能在块中的地址之后对 sed 命令进行分组?

Kon*_*lph 11 sed

我正在尝试使用sed打印所有行,直到但不包括特定模式。我不明白为什么以下不起作用:

sed '/PATTERN/{d;q}' file
Run Code Online (Sandbox Code Playgroud)

根据我对 sed 脚本的理解,这个表达式应该会导致以下情况:

  • 当一行匹配时/PATTERN/,执行由命令组成的组
    1. d删除模式空间(=当前行)
    2. q打印当前模式空间后的 uit

孤立地,既/PATTERN/d/PATTERN/q工作;也就是说,d删除有问题的行,并q导致sed终止,但在打印行之后,如文档所述。但是将这两个操作组合在一个块中似乎会导致q被忽略。

我知道我可以使用Q而不是{d;q}作为 GNU 扩展(这按预期工作!)但我有兴趣了解为什么上述不起作用,以及我以何种方式误解了文档。


我的实际用例(只是稍微)更复杂,因为文件的第一行实际上与模式匹配,我跳过它(在做了一些替换之后):

sed -e '1{s/>21/>chr21/; n}' -e '/>/{d;q}' in.fasta >out.fasta
Run Code Online (Sandbox Code Playgroud)

但是上面的简化案例表现出相同的行为。

Kus*_*nda 14

要输出文件的所有行直到匹配特定模式(并且输出该匹配行),您可以使用

sed -n '/PATTERN/q; p;' file
Run Code Online (Sandbox Code Playgroud)

在这里,每个循环结束时模式空间的默认输出被禁用-n。相反,我们使用p. 如果给定的模式匹配,我们用 停止处理q

实际的,较长的,命令,该命令从只是改变21号染色体的名称21chr21一个FASTA文件的第一行,然后前进,直到它遇到下一个FASTA标题行,以提取对于该染色体DNA的,可以被写为

sed -n '/PATTERN/q; p;' file
Run Code Online (Sandbox Code Playgroud)

或者

sed -n -e '1 { s/^>21/>chr21/p; d; }' \
       -e '/^>/q' \
       -e p <in.fasta >out.fasta
Run Code Online (Sandbox Code Playgroud)

您的原始表达式的问题在于它d开始了一个新的循环(即,它强制将下一行读入模式空间并且跳转到脚本的开头)。这意味着q永远不会被执行。

请注意,为了在非 GNU 系统上语法正确,您的原始脚本应类似于/PATTERN/ { d; q; }. 注意;后面的添加q(空格不重要)。


gle*_*man 9

d不只是删除模式空间:来自POSIX 规范

[2addr]d

删除模式空间并开始下一个循环

(我的重点)

q命令无法访问。

  • 此外,如果使用非 GNU `sed`,则直接在 `}` 之前(在同一行)的命令必须以 `;` 终止。 (5认同)