我正在尝试使用sed
打印所有行,直到但不包括特定模式。我不明白为什么以下不起作用:
sed '/PATTERN/{d;q}' file
Run Code Online (Sandbox Code Playgroud)
根据我对 sed 脚本的理解,这个表达式应该会导致以下情况:
/PATTERN/
,执行由命令组成的组
d
删除模式空间(=当前行)q
打印当前模式空间后的 uit孤立地,既/PATTERN/d
和/PATTERN/q
工作;也就是说,d
删除有问题的行,并q
导致sed
终止,但在打印行之后,如文档所述。但是将这两个操作组合在一个块中似乎会导致q
被忽略。
我知道我可以使用Q
而不是{d;q}
作为 GNU 扩展(这按预期工作!)但我有兴趣了解为什么上述不起作用,以及我以何种方式误解了文档。
我的实际用例(只是稍微)更复杂,因为文件的第一行实际上与模式匹配,我跳过它(在做了一些替换之后):
sed -e '1{s/>21/>chr21/; n}' -e '/>/{d;q}' in.fasta >out.fasta
Run Code Online (Sandbox Code Playgroud)
但是上面的简化案例表现出相同的行为。
Kus*_*nda 14
要输出文件的所有行直到匹配特定模式(并且不输出该匹配行),您可以使用
sed -n '/PATTERN/q; p;' file
Run Code Online (Sandbox Code Playgroud)
在这里,每个循环结束时模式空间的默认输出被禁用-n
。相反,我们使用p
. 如果给定的模式匹配,我们用 停止处理q
。
实际的,较长的,命令,该命令从只是改变21号染色体的名称21
到chr21
一个FASTA文件的第一行,然后前进,直到它遇到下一个FASTA标题行,以提取对于该染色体DNA的,可以被写为
sed -n '/PATTERN/q; p;' file
Run Code Online (Sandbox Code Playgroud)
或者
sed -n -e '1 { s/^>21/>chr21/p; d; }' \
-e '/^>/q' \
-e p <in.fasta >out.fasta
Run Code Online (Sandbox Code Playgroud)
您的原始表达式的问题在于它d
开始了一个新的循环(即,它强制将下一行读入模式空间并且跳转到脚本的开头)。这意味着q
永远不会被执行。
请注意,为了在非 GNU 系统上语法正确,您的原始脚本应类似于/PATTERN/ { d; q; }
. 注意;
后面的添加q
(空格不重要)。