-1 shell-script text-processing bioinformatics
如何将带有“>”的fasta格式转换为纯文本文件ex。输入:fasta文件
>1M14
GATCGGACTAGCTAA
Run Code Online (Sandbox Code Playgroud)
输出:纯文本文件
GATCGGACGAGCTAA
Run Code Online (Sandbox Code Playgroud)
fasta 文件格式已经是纯文本格式。您要做的是将您的 fasta 文件转换为仅包含 DNA 序列的文件。
要从 fasta 文件中删除所有标题行,只需删除以 开头的行>:
grep -v '^>' fastafile >newfile
Run Code Online (Sandbox Code Playgroud)
您可能需要查看StackExchange Bioinformatics 站点。
该grep -v命令删除与给定正则表达式匹配的行。正则表达式^>匹配以字符开头的行>。
有关如何反向、补充和/或反向互补仅包含 DNA 序列的文件,请参阅我对您之前问题之一的回答的结尾。