我有文件 1,它只包含一列是基因列表,文件 2 有更长的基因列表和基因的统计数据。我试图找到与文件 1 中的基因匹配的统计数据并将其放入新文件 3 中。在特定文件 2 中有 33 列,我想要的唯一统计数据在第 29 列中,但是我目前一直在写为每一列查找文件 1 基因信息的代码,因为我仍然坚持这一点。
例如我的数据看起来像:
文件 1:
Gene
ACE
BRCA
HER.2
NOS
P53
PTGIS
Run Code Online (Sandbox Code Playgroud)
文件2:
gene_id Gene pval beta maf ... qval ...
12345 ACE 0.01 300 100 0.0008
67890 UMOD.1 0.002 400 45 0.047
00008 HER.2 0.02 123 98 0.56
34587 CICP3 0.05 55 12 0.77
67859 HER 0.003 600 33 0.234
Run Code Online (Sandbox Code Playgroud)
我想要的第 29 列是qval
并且我曾经...
暗示过在第 29 列之前和之后的更多列,但是我对 stackexchange 缺乏经验,如果有办法让我提供完整的更大数据以获得更好的示例,请告诉我,我会立即做。
使用这些示例数据集,输出文件 3 将如下所示:
Gene …
Run Code Online (Sandbox Code Playgroud) 我有很多 txt 文件,名称为“file1.txt file2.txt file3.txt ... file1000.txt
如何删除所有这些文件?” 我是 unix 新手,担心意外删除目录中的其他文件。
我看过其他问题,但我不确定,我可以做类似的事情吗
rm -v !("differentfile"|"anotherfile"|"otherfile"|"finalfile")
Run Code Online (Sandbox Code Playgroud)
因此删除所有具有相同名称和不同编号的文件并保留我想要的几个文件?此行应该只删除我的工作目录/文件夹中的文件,正确吗?
有没有办法使用 rm 但只删除我想一次性删除的特定文件?