相关疑难解决方法(0)

根据第一列的两个文件的交集

我在文件 A 中有两个文件,另一个文件 B 中有序列号,有很多列,第一列是序列号,我想得到一个文件,其中包含 B 中的所有行,其中的序列号在我怎样才能做到这一点?谢谢

像文件A

1
3
8
9
20
Run Code Online (Sandbox Code Playgroud)

文件B

1 kfjk 3243424
2 fkdkf 23543592
3 iefjk 21493402
7 dlafdl 23435231
8 kfkdlkf 309834
Run Code Online (Sandbox Code Playgroud)

shell scripting text-processing columns join

7
推荐指数
1
解决办法
6207
查看次数

基本的 grep/awk 帮助 - 将包含术语列表的所有行从一个文件中提取到一个单独的文件中

我有两个文件genelist.txtdata.txt. genelist.txt仅包含约 500 个基因名称的单列,而data.txt包含约 1000 列(样本)和约 30,000 行(基因名称)的制表符分隔文件。的一般方案data.txt概述如下。

       Sample 1 Sample 2 Sample 3 Sample 4  Gene A      1.04       1.81        1.92        0.45     Gene B      1.11       1.12        1.32        0.92     Gene C      0.72       0.71        0.85        1.12     Gene D      1.19       1.42        0.13        0.32   

我需要从data.txt包含约 500 个基因名称中的每一个中提取每一行(整行,即所有样本),genelist.txt并将这些行提取到一个单独的文件中。有人告诉我使用 grep 或 awk 并研究了如何做到这一点,但是作为一个简单的生物学家,几乎没有/没有编码经验,我遇到了一些麻烦。是否有人可以解释这是如何完成的,并希望为我提供一些代码以开始工作。

如果提取仅返回与genelist.txt. 举例来说,如果我有ABC123但不ABC1234genelist.txt,我想只有ABC123被提取,而不是ABC1234

此外,完成此操作后,我将如何检查我的哪些基因genelist.txt未包含在提取中?(即某些基因可能命名不正确,因此我必须返回并使用其替代和/或正确名称重新提取它们)。

grep awk

7
推荐指数
1
解决办法
4万
查看次数

标签 统计

awk ×1

columns ×1

grep ×1

join ×1

scripting ×1

shell ×1

text-processing ×1