小编Dis*_*coA的帖子

基本的 grep/awk 帮助 - 将包含术语列表的所有行从一个文件中提取到一个单独的文件中

我有两个文件genelist.txt和data.txt. genelist.txt仅包含约 500 个基因名称的单列，而data.txt包含约 1000 列（样本）和约 30,000 行（基因名称）的制表符分隔文件。的一般方案data.txt概述如下。

Sample 1 Sample 2 Sample 3 Sample 4 Gene A 1.04 1.81 1.92 0.45 Gene B 1.11 1.12 1.32 0.92 Gene C 0.72 0.71 0.85 1.12 Gene D 1.19 1.42 0.13 0.32

我需要从data.txt包含约 500 个基因名称中的每一个中提取每一行（整行，即所有样本），genelist.txt并将这些行提取到一个单独的文件中。有人告诉我使用 grep 或 awk 并研究了如何做到这一点，但是作为一个简单的生物学家，几乎没有/没有编码经验，我遇到了一些麻烦。是否有人可以解释这是如何完成的，并希望为我提供一些代码以开始工作。

如果提取仅返回与genelist.txt. 举例来说，如果我有ABC123但不ABC1234中genelist.txt，我想只有ABC123被提取，而不是ABC1234。

此外，完成此操作后，我将如何检查我的哪些基因genelist.txt未包含在提取中？（即某些基因可能命名不正确，因此我必须返回并使用其替代和/或正确名称重新提取它们）。

grep awk

Dis*_*coA

2018 05-22

7
推荐指数

1
解决办法

4万
查看次数

标签统计

awk ×1

grep ×1

基本的 grep/awk 帮助 - 将包含术语列表的所有行从一个文件中提取到一个单独的文件中

标签 统计

小编Dis_coA的帖子

标签统计