我想计算“X”之间的线数。这只是一个例子;我必须将代码应用于复杂的生物学结果。如果您能建议一些命令,最好使用awk,grep或者sed我熟悉这些命令,我将不胜感激。
例子:
X
Y
Y
Y
X
Y
Y
Y
Y
X
Y
X
Run Code Online (Sandbox Code Playgroud)
期望输出:
3
4
1
Run Code Online (Sandbox Code Playgroud) 我有两个文件文件 A 和文件 B
文件 A 包含所有信息,而文件 B 包含唯一的信息 ID。我想要做的是比较两个文件并grep文件A中的ids信息
文件A:
acb:A1S_1863 ncbi-proteinid:ABO12290
acb:A1S_1864 ncbi-proteinid:ABO12291
acb:A1S_1865 ncbi-proteinid:ABO12292
acb:A1S_0105 ncbi-proteinid:ABO10592
acb:A1S_0106 ncbi-proteinid:ABO10593
Run Code Online (Sandbox Code Playgroud)
文件 B:
A1S_1865
A1S_1774
A1S_1116
A1S_0106
A1S_2677
Run Code Online (Sandbox Code Playgroud)
所需的输出:
acb:A1S_1865 ncbi-proteinid:ABO12292
acb:A1S_0106 ncbi-proteinid:ABO10593
Run Code Online (Sandbox Code Playgroud) 我想打印这个文件的第 1 列。我使用了这个命令:awk '{print $1}'但它只打印了第一列的第一个单词。
数据
ABC transporters ABC transporters
Alanine, aspartate and glutamate metabolism Alanine, aspartate
alpha-Linolenic acid metabolism alpha-Linolenic acid metabolism
Aminoacyl-tRNA biosynthesis Aminoacyl-tRNA biosynthesis
Amino sugar and nucleotide sugar metabolism Amino sugar and nucleotide
Arachidonic acid metabolism Arachidonic
Run Code Online (Sandbox Code Playgroud)
输出:
ABC
Alanine,
alpha-Linolenic
Aminoacyl-tRNA
Amino
Arachidonic
Run Code Online (Sandbox Code Playgroud)
期望输出:
ABC transporters
Alanine, aspartate and glutamate metabolism
alpha-Linolenic acid metabolism
Aminoacyl-tRNA biosynthesis
Amino sugar and nucleotide sugar metabolism
Arachidonic acid metabolism
Run Code Online (Sandbox Code Playgroud) 我们如何使用 shell 命令将道尔顿值转换为千道尔顿?我有值的列表道尔顿。一千道尔顿有 1000 道尔顿,因此需要将每个值除以一千。
样本数据:
12345.09
236575.665
18865.41
45678.87
Run Code Online (Sandbox Code Playgroud)
期望的输出:
12.34509
236.575665
18.86541
45.67887
Run Code Online (Sandbox Code Playgroud) 我想在>&之后 grep 数据 |。我使用了这个命令:
grep -o ' |.*$'| cut -c5-
Run Code Online (Sandbox Code Playgroud)
但它只是在以下之后提供数据|:
> Aminobenzoate
Asthma | Atrazine
Autoimmune thyroid disease | Bacterial
B cell receptor signaling pathway | Benzoate
Bile secretion | beta-Lactam
> Biosynthesis
Caffeine metabolism | Caprolactam
Calcium signaling pathway | Carbapenem
Run Code Online (Sandbox Code Playgroud)
Aminobenzoate
Atrazine
Bacterial
Benzoate
beta-Lactam
Biosynthesis
Caprolactam
Carbapenem
Run Code Online (Sandbox Code Playgroud) 我想知道 'ABCD'(文件 A)在 DB(文件 B)中出现了多少次。同样,我想知道文件 A 中针对 DB 的每一行。我需要一个可以简化我的工作的自动化命令,因为我在文件 A 中有大量数据,我想在许多数据库中搜索它。我只是为了理解而将字符加粗。
ABCD
EFG
HIJKL
MNO
PQRSTU
Run Code Online (Sandbox Code Playgroud)
XYZ ABCD FORNTUFPSRWSABCFYWSZCFTHBFORTYBJNF ABCD D EFG ACVRT EFG PQRMNOOPQ EFG ZXXXYY
ABCD 2
EFG 3
HIJKL 4567
MNO 0
PQRSTU 7652
Run Code Online (Sandbox Code Playgroud)