小编Rhe*_*hea的帖子

计算“X”之间的行数

我想计算“X”之间的线数。这只是一个例子;我必须将代码应用于复杂的生物学结果。如果您能建议一些命令,最好使用awkgrep或者sed我熟悉这些命令,我将不胜感激。

例子:

X
Y
Y
Y
X
Y
Y
Y
Y
X
Y
X
Run Code Online (Sandbox Code Playgroud)

期望输出:

3
4
1
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

13
推荐指数
3
解决办法
2153
查看次数

如何通过比较两个文件来grep相同的字符串

我有两个文件文件 A 和文件 B

文件 A 包含所有信息,而文件 B 包含唯一的信息 ID。我想要做的是比较两个文件并grep文件A中的ids信息

文件A:

acb:A1S_1863    ncbi-proteinid:ABO12290
acb:A1S_1864    ncbi-proteinid:ABO12291
acb:A1S_1865    ncbi-proteinid:ABO12292
acb:A1S_0105    ncbi-proteinid:ABO10592
acb:A1S_0106    ncbi-proteinid:ABO10593
Run Code Online (Sandbox Code Playgroud)

文件 B:

A1S_1865
A1S_1774
A1S_1116
A1S_0106
A1S_2677
Run Code Online (Sandbox Code Playgroud)

所需的输出:

acb:A1S_1865    ncbi-proteinid:ABO12292
acb:A1S_0106    ncbi-proteinid:ABO10593
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

9
推荐指数
1
解决办法
4564
查看次数

打印第一列

我想打印这个文件的第 1 列。我使用了这个命令:awk '{print $1}'但它只打印了第一列的第一个单词。

数据

ABC transporters                             ABC transporters
Alanine, aspartate and glutamate metabolism  Alanine, aspartate 
alpha-Linolenic acid metabolism              alpha-Linolenic acid metabolism
Aminoacyl-tRNA biosynthesis                  Aminoacyl-tRNA biosynthesis
Amino sugar and nucleotide sugar metabolism  Amino sugar and nucleotide
Arachidonic acid metabolism                  Arachidonic 
Run Code Online (Sandbox Code Playgroud)

输出:

ABC
Alanine,
alpha-Linolenic
Aminoacyl-tRNA
Amino
Arachidonic
Run Code Online (Sandbox Code Playgroud)

期望输出:

ABC transporters
Alanine, aspartate and glutamate metabolism
alpha-Linolenic acid metabolism 
Aminoacyl-tRNA biosynthesis 
Amino sugar and nucleotide sugar metabolism 
Arachidonic acid metabolism 
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

6
推荐指数
2
解决办法
3198
查看次数

将值从道尔顿转换为千道尔顿(值除以 1000)

我们如何使用 shell 命令将道尔顿值转换为千道尔顿?我有值的列表道尔顿。一千道尔顿有 1000 道尔顿,因此需要将每个值除以一千。

样本数据:

12345.09
236575.665
18865.41
45678.87
Run Code Online (Sandbox Code Playgroud)

期望的输出:

12.34509
236.575665
18.86541
45.67887
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

5
推荐指数
3
解决办法
1549
查看次数

如何在两个特殊字符后对文本进行 grep?

我想在>&之后 grep 数据 |。我使用了这个命令:

grep -o '  |.*$'| cut -c5-
Run Code Online (Sandbox Code Playgroud)

但它只是在以下之后提供数据|

                                                              > Aminobenzoate
Asthma                                                        | Atrazine
Autoimmune thyroid disease                                    | Bacterial
B cell receptor signaling pathway                             | Benzoate
Bile secretion                                                | beta-Lactam
                                                              > Biosynthesis
Caffeine metabolism                                           | Caprolactam
Calcium signaling pathway                                     | Carbapenem
Run Code Online (Sandbox Code Playgroud)

期望的输出:

Aminobenzoate
Atrazine
Bacterial
Benzoate
beta-Lactam
Biosynthesis
Caprolactam
Carbapenem
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

4
推荐指数
2
解决办法
6503
查看次数

自动计算出现次数

我想知道 'ABCD'(文件 A)在 DB(文件 B)中出现了多少次。同样,我想知道文件 A 中针对 DB 的每一行。我需要一个可以简化我的工作的自动化命令,因为我在文件 A 中有大量数据,我想在许多数据库中搜索它。我只是为了理解而将字符加粗。

文件A

ABCD
EFG
HIJKL
MNO
PQRSTU
Run Code Online (Sandbox Code Playgroud)

文件B

XYZ ABCD FORNTUFPSRWSABCFYWSZCFTHBFORTYBJNF ABCD D EFG ACVRT EFG PQRMNOOPQ EFG ZXXXYY

期望的输出:

ABCD  2
EFG   3
HIJKL 4567
MNO   0
PQRSTU 7652
Run Code Online (Sandbox Code Playgroud)

command-line text-processing

3
推荐指数
3
解决办法
1507
查看次数

标签 统计

command-line ×6

text-processing ×6