小编Rhe*_*hea的帖子

比较文件 B 与 A 并使用 awk 、sed 或 grep 从 A 中提取数据

我有两个文件文件 A,其中包含所有数据,而另一个文件 B 只有 ID,我想要将文件 B 与文件 A 进行比较并检索该 ID 中存在的数据。我正在使用 Suse Linux。

文件A

C    02020 Two-component system [PATH:aap02020]
D      NT05HA_1798 sensor protein CpxA  
D      NT05HA_1797 CpxR K07662 cpxR
C    02030 *Bacterial chemotaxis* [PATH:aap02030]
D      NT05HA_0919 maltose-binding periplasmic protein
D      NT05HA_0918 maltose-binding periplasmic protein 
C    03070 *Bacterial secretion system* [PATH:aap03070]
D      NT05HA_1309 protein-export membrane protein SecD 
D      NT05HA_1310 protein-export membrane protein SecF 
D      NT05HA_1819 preprotein translocase subunit SecE
D      NT05HA_1287 protein-export membrane protein  
C    02060 Phosphotransferase system (PTS) [PATH:aap02060]
D …
Run Code Online (Sandbox Code Playgroud)

grep awk

3
推荐指数
1
解决办法
1265
查看次数

如果下一行包含则打印

我有一个文本文件,需要从中找到 0 个发现蛋白质。我正在使用 Linux suse。任何使用 awk 或 sed 的命令将不胜感激

# BLASTP 2.2.31+
# Query: ABO10498.2 DNA replication initiator protein [Acinetobacter baumannii ATCC 17978]
# Database: uniprot-reviewed%3Ayes+AND+proteome%3Aup000005640.fasta
# Fields: query id, subject id, evalue, % identity, % query coverage per subject
# 1 hits found
# BLASTP 2.2.31+
# Query: ABO10538.2 hypothetical protein A1S_0043 [Acinetobacter baumannii ATCC 17978]
# Database: uniprot-reviewed%3Ayes+AND+proteome%3Aup000005640.fasta
# 0 hits found
# Query: ABO10591.2 putative acetyl-coA synthetase/AMP-(fatty) acid ligase [Acinetobacter baumannii ATCC 17978]
# Database: uniprot-reviewed%3Ayes+AND+proteome%3Aup000005640.fasta
# …
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

1
推荐指数
1
解决办法
537
查看次数

标签 统计

awk ×1

command-line ×1

grep ×1

text-processing ×1