Eth*_*han 1 unix sed bioinformatics fasta
我知道这应该很简单,但我不能让它工作.我的文件看起来像这样
>c12345|random info goes here that I want to delete
AAAAATTTTTTTTCCCC
>c45678| more | random info| here
GGGGGGGGGGG
Run Code Online (Sandbox Code Playgroud)
而我想要做的就是让它变得更加简单,所以它可能看起来像这样
>seq1 [organism=human]
AAAAATTTTTTTTCCCC
>seq2 [organism=human]
GGGGGGGGGGGG
>seq3 [organism=human]
etc....
Run Code Online (Sandbox Code Playgroud)
我知道一旦我通过执行以下操作获得索引部分,我就可以轻松追加该常量:
sed '/^>/ s/$/\[organism-human]/g'
Run Code Online (Sandbox Code Playgroud)
但是如何构建该索引呢?
用sed:
sed '/^>/d' filename | sed '=' | sed 's/^[0-9]*$/>seq& [organism=human]/'
Run Code Online (Sandbox Code Playgroud)
(感谢NeronLeVelu的简化.)