使用bash在文本文件中提取2个标记之间的行

Question

我有一个文本文件,如下所示:

random useless text 
<!-- this is token 1 --> 
para1 
para2 
para3 
<!-- this is token 2 --> 
random useless text again

我想在令牌之间提取文本(当然不包括令牌).我尝试使用##和%%来提取数据,但它不起作用.我认为它不适用于操纵如此大的文本文件.有什么建议我怎么做？也许awk或sed？

Answer 1

不需要head和tail/ grep或多次读取文件:

sed -n '/<!-- this is token 1 -->/{:a;n;/<!-- this is token 2 -->/b;p;ba}' inputfile

说明:

Answer 2

你可以提取它,包括带有sed的标记.然后用头部和尾部剥去令牌.

... | sed -n "/this is token 1/,/this is token 2/p" | head -n-1 | tail -n+2