我有一个 .vcf.gz 文件,具有以下方面:
#CHROM POS ID REF ALT
chr1 10894 chr1:10894:G:A G A
chr1 10915 chr1:10915:G:A G A
chr1 10930 chr1:10930:G:A G A
Run Code Online (Sandbox Code Playgroud)
我想修改 CHROM 列以删除“chr”并将其替换为任何内容,因此我希望得到如下结果:
#CHROM POS ID REF ALT
1 10894 chr1:10894:G:A G A
1 10915 chr1:10915:G:A G A
1 10930 chr1:10930:G:A G A
Run Code Online (Sandbox Code Playgroud)
因此,我编写了以下命令行:
zcat input.vcf.gz | sed 's/^chr//' > output.vcf.gz
Run Code Online (Sandbox Code Playgroud)
它起作用了。问题是我想将输出文件保存为压缩文件,扩展名为 vcf.gz。即使我写了“output.vcf.gz”,输出文件也不会被压缩。
如何修改压缩文件然后再次将其另存为压缩文件?
非常感谢!