我有一个文件,其中包含有关所有23对染色体(CHROM)的信息.我希望只有染色体1的所有信息写入输出文件.因此,该行的第一个字符仅为"1".
我怎样才能使用sed或(awk?)来做到这一点?
我在下面尝试了这个但是添加了行号以及其他错误...
sed -e = '/^1/' input.vcf > output_CHROM1.vcf
Run Code Online (Sandbox Code Playgroud)
示例文件:
##INFO=<ID=AA,Number=1,Type=String,Description="Ancestral Allele">
#CHROM POS ID REF ALT QUAL FILTER INFO
1 69224 COSM3677745 A C . . COSMIC_71;TSA=SNV
2 69230 COSM3677746 A C . . COSMIC_71;TSA=SNV
23 69230 COSM3677746 A C . . COSMIC_71;TSA=SNV
Run Code Online (Sandbox Code Playgroud)
一个简单而且非常典型的任务grep:
grep '^1\b' input.vcf > output_CHROM1.vcf
Run Code Online (Sandbox Code Playgroud)