将 fasta 文件转换为纯文本

-1 shell-script text-processing bioinformatics

如何将带有“>”的fasta格式转换为纯文本文件ex。输入:fasta文件

>1M14
GATCGGACTAGCTAA
Run Code Online (Sandbox Code Playgroud)

输出:纯文本文件

GATCGGACGAGCTAA
Run Code Online (Sandbox Code Playgroud)

Kus*_*nda 5

fasta 文件格式已经是纯文本格式。您要做的是将您的 fasta 文件转换为仅包含 DNA 序列的文件。

要从 fasta 文件中删除所有标题行,只需删除以 开头的行>

grep -v '^>' fastafile >newfile
Run Code Online (Sandbox Code Playgroud)

您可能需要查看StackExchange Bioinformatics 站点


grep -v命令删除与给定正则表达式匹配的行。正则表达式^>匹配以字符开头的行>


有关如何反向、补充和/或反向互补仅包含 DNA 序列的文件,请参阅我对您之前问题之一的回答的结尾。