相关疑难解决方法(0)

grep 命令报错

我正在使用 grep 过滤掉某些模式(在我的例子中是基因)的内容。欲了解更多信息,这里是较早的链接。

从另一个文件中列出的文件中查找模式

我的代码(应该工作)但不是。

 grep -f file1 file2
Run Code Online (Sandbox Code Playgroud)

这是我的基因子集(file1):

C1QTNF3
C5orf22
C5orf28
C5orf34
C5orf38
C5orf42
C5orf49
C5orf51
C5orf64
C6
C7
C9
CAPSL
CARD6
CARTPT
CCDC125
CCDC152
CCL28
CCNB1
CCNO
CCT5
CD180
CDC20B
CDH10
CDH12
CDH18
CDH6
CDH9
CDK7
CENPH
CENPK
CKMT2
CLPTM1L
CMBL
CMYA5
COL4A3BP
CR749689
CRHBP
CRSP8P
CT49
CTNND2
CWC27
DAB2
DAP
DDX4
DEPDC1B
DHFR
DHX29
DIMT1
DMGDH
Run Code Online (Sandbox Code Playgroud)

下面是我的文本文件(file2),它正在匹配,即使文件 1 中没有基因 UNC79,如 SNPEFF_GENE_NAME=UNC79 所示,文件 2 中显示存在。

  AC=3;AF=0.016;AN=186;BaseQRankSum=0.075;DB;DP=292;Dels=0.00;FS=4.271;HaplotypeScore=0.0891;InbreedingCoeff=0.0225;MLEAC=2;MLEAF=0.011;MQ=59.18;MQ0=1;MQRankSum=0.969;QD=13.42;ReadPosRankSum=-0.373;SNPEFF_EFFECT=INTRON;SNPEFF_EXON_ID=23;SNPEFF_FUNCTIONAL_CLASS=NONE;SNPEFF_GENE_BIOTYPE=protein_coding;SNPEFF_GENE_NAME=UNC79;SNPEFF_IMPACT=MODIFIER;SNPEFF_TRANSCRIPT_ID=ENST00000256339;VQSLOD=9.31;culprit=DP
Run Code Online (Sandbox Code Playgroud)

因此,grep 的输出是来自 file2 的整个文本 blob。

下面是文件中的完整行,它给出了问题。第二列是基因名称。我的file1中没有这个基因。所以我不想要这个特定行的输出。我有 1000 行这样的不同基因,只需要过滤掉文件 1 中的基因。

    intronic …
Run Code Online (Sandbox Code Playgroud)

grep

5
推荐指数
2
解决办法
1398
查看次数

标签 统计

grep ×1