Sup*_*ech 5 ruby python unix perl
我有一个如下所示的行文件,并希望转换为两列格式.
>00000_x1688514
TGCTTGGACTACATATGGTTGAGGGTTGTA
>00001_x238968
TGCTTGGACTACATATTGTTGAGGGTTGTA
...
Run Code Online (Sandbox Code Playgroud)
期望的输出是
>00000_x1688514 TGCTTGGACTACATATGGTTGAGGGTTGTA
>00001_x238968 TGCTTGGACTACATATTGTTGAGGGTTGTA
...
Run Code Online (Sandbox Code Playgroud)
我将不胜感激任何帮助.谢谢.
我不知道您是否了解BioPerl模块的读/写和其他遗传功能.你的问题可以像这样写.
#!/usr/bin/perl
use strict;
use warnings;
use Bio::SeqIO;
my $file = 'o33.txt';
my $in = Bio::SeqIO->new( -file => $file,
-format => 'fasta');
while ( my $seq = $in->next_seq() ) {
print $seq->id, "\t", $seq->seq, "\n";
}
__END__
00000_x1688514 TGCTTGGACTACATATGGTTGAGGGTTGTA
00001_x238968 TGCTTGGACTACATATTGTTGAGGGTTGTA
Run Code Online (Sandbox Code Playgroud)
在python中:
fd = open('filepath')
cols = izip(fd, fd)
with open('output_filepath') as outfile:
for col in cols:
outfile.write('\t'.join(col).replace('\n', '') +'\n')
Run Code Online (Sandbox Code Playgroud)
所需的输出应该是 output_filepath