小编Rhe*_*hea的帖子

计算“X”之间的行数

我想计算“X”之间的线数。这只是一个例子；我必须将代码应用于复杂的生物学结果。如果您能建议一些命令，最好使用awk，grep或者sed我熟悉这些命令，我将不胜感激。

例子：

X
Y
Y
Y
X
Y
Y
Y
Y
X
Y
X

Run Code Online (Sandbox Code Playgroud)

期望输出：

3
4
1

Run Code Online (Sandbox Code Playgroud)

command-line text-processing

Rhe*_*hea

2017 09-08

13
推荐指数

3
解决办法

2153
查看次数

如何通过比较两个文件来grep相同的字符串

我有两个文件文件 A 和文件 B

文件 A 包含所有信息，而文件 B 包含唯一的信息 ID。我想要做的是比较两个文件并grep文件A中的ids信息

文件A：

acb:A1S_1863    ncbi-proteinid:ABO12290
acb:A1S_1864    ncbi-proteinid:ABO12291
acb:A1S_1865    ncbi-proteinid:ABO12292
acb:A1S_0105    ncbi-proteinid:ABO10592
acb:A1S_0106    ncbi-proteinid:ABO10593

Run Code Online (Sandbox Code Playgroud)

文件 B：

A1S_1865
A1S_1774
A1S_1116
A1S_0106
A1S_2677

Run Code Online (Sandbox Code Playgroud)

所需的输出：

acb:A1S_1865    ncbi-proteinid:ABO12292
acb:A1S_0106    ncbi-proteinid:ABO10593

Run Code Online (Sandbox Code Playgroud)

command-line text-processing

Rhe*_*hea

2017 05-17

9
推荐指数

1
解决办法

4564
查看次数

打印第一列

我想打印这个文件的第 1 列。我使用了这个命令：awk '{print $1}'但它只打印了第一列的第一个单词。

数据

ABC transporters                             ABC transporters
Alanine, aspartate and glutamate metabolism  Alanine, aspartate 
alpha-Linolenic acid metabolism              alpha-Linolenic acid metabolism
Aminoacyl-tRNA biosynthesis                  Aminoacyl-tRNA biosynthesis
Amino sugar and nucleotide sugar metabolism  Amino sugar and nucleotide
Arachidonic acid metabolism                  Arachidonic

Run Code Online (Sandbox Code Playgroud)

输出：

ABC
Alanine,
alpha-Linolenic
Aminoacyl-tRNA
Amino
Arachidonic

Run Code Online (Sandbox Code Playgroud)

期望输出：

ABC transporters
Alanine, aspartate and glutamate metabolism
alpha-Linolenic acid metabolism 
Aminoacyl-tRNA biosynthesis 
Amino sugar and nucleotide sugar metabolism 
Arachidonic acid metabolism

Run Code Online (Sandbox Code Playgroud)

command-line text-processing

Rhe*_*hea

2017 05-16

6
推荐指数

2
解决办法

3198
查看次数

将值从道尔顿转换为千道尔顿（值除以 1000）

我们如何使用 shell 命令将道尔顿值转换为千道尔顿？我有值的列表道尔顿。一千道尔顿有 1000 道尔顿，因此需要将每个值除以一千。

样本数据：

Run Code Online (Sandbox Code Playgroud)

期望的输出：

Run Code Online (Sandbox Code Playgroud)

command-line text-processing

Rhe*_*hea

2017 09-26

5
推荐指数

3
解决办法

1549
查看次数

如何在两个特殊字符后对文本进行 grep？

我想在>&之后 grep 数据 |。我使用了这个命令：

grep -o '  |.*$'| cut -c5-

Run Code Online (Sandbox Code Playgroud)

但它只是在以下之后提供数据|：

                                                              > Aminobenzoate
Asthma                                                        | Atrazine
Autoimmune thyroid disease                                    | Bacterial
B cell receptor signaling pathway                             | Benzoate
Bile secretion                                                | beta-Lactam
                                                              > Biosynthesis
Caffeine metabolism                                           | Caprolactam
Calcium signaling pathway                                     | Carbapenem

Run Code Online (Sandbox Code Playgroud)

期望的输出：

Aminobenzoate
Atrazine
Bacterial
Benzoate
beta-Lactam
Biosynthesis
Caprolactam
Carbapenem

Run Code Online (Sandbox Code Playgroud)

command-line text-processing

Rhe*_*hea

2017 05-12

4
推荐指数

2
解决办法

6503
查看次数

自动计算出现次数

我想知道 'ABCD'（文件 A）在 DB（文件 B）中出现了多少次。同样，我想知道文件 A 中针对 DB 的每一行。我需要一个可以简化我的工作的自动化命令，因为我在文件 A 中有大量数据，我想在许多数据库中搜索它。我只是为了理解而将字符加粗。

文件A

ABCD
EFG
HIJKL
MNO
PQRSTU

Run Code Online (Sandbox Code Playgroud)

文件B

XYZ ABCD FORNTUFPSRWSABCFYWSZCFTHBFORTYBJNF ABCD D EFG ACVRT EFG PQRMNOOPQ EFG ZXXXYY

期望的输出：

ABCD  2
EFG   3
HIJKL 4567
MNO   0
PQRSTU 7652

Run Code Online (Sandbox Code Playgroud)

command-line text-processing

Rhe*_*hea

2017 06-19

3
推荐指数

3
解决办法

1507
查看次数

标签统计

command-line ×6

text-processing ×6

计算“X”之间的行数

如何通过比较两个文件来grep相同的字符串

打印第一列

将值从道尔顿转换为千道尔顿（值除以 1000）

如何在两个特殊字符后对文本进行 grep？

期望的输出：

自动计算出现次数

文件A

文件B

期望的输出：

标签 统计

小编Rhe_hea的帖子

标签统计