编辑 FASTA 标头

kat*_* HM 3 command-line sed text-processing

我想删除 fasta 文件中所有序列的部分标头,因此只有 Otu 编号显示为标头。

所以来自:

>M02300_51_000000000-CJMTC_1_1115_17014_15334   Otu0001  
T-AC--GG-AG-GGT---GCA-A-G-C--G-T-T--AA-T-CGG-AA--TT-A-C-T
Run Code Online (Sandbox Code Playgroud)

我想将其更改为:

>Otu0001  
T-AC--GG-AG-GGT---GCA-A-G-C--G-T-T--AA-T-CGG-AA--TT-A-C-T
Run Code Online (Sandbox Code Playgroud)

我相信这应该可以通过 sed 命令实现,但还未能使其工作。任何帮助都会很棒!先感谢您。

ste*_*ver 5

我对 FASTA 的结构一无所知,但是如果子字符串Otu不能出现在标头中的其他任何位置,那么

sed 's/^>.*Otu/>Otu/' file.fasta
Run Code Online (Sandbox Code Playgroud)

应该这样做