我有 20 个具有相同行数的制表符分隔文件。我想选择每个文件的第 4 列,粘贴到一个新文件中。最后,新文件将有 20 列,每列来自 20 个不同的文件。
如何使用 Unix/Linux 命令执行此操作?
输入,20 个相同格式。我希望文件 1 的第 4 列在此处表示为 A1:
chr1 1734966 1735009 A1 0 0 0 0 0 1 0
chr1 2074087 2083457 A1 0 1 0 0 0 0 0
chr1 2788495 2788535 A1 0 0 0 0 0 0 0
chr1 2821745 2822495 A1 0 0 0 0 0 1 0
chr1 2821939 2822679 A1 1 0 0 0 0 0 0
...
Run Code Online (Sandbox Code Playgroud)
输出文件,有 20 列,每列来自 …
我有一个这样的制表符分隔文件:
chr1 53736473 54175786
chr1 56861276 56876438
chr1 57512145 57512200
Run Code Online (Sandbox Code Playgroud)
我想像这样连接三个字段结果:
chr1:53736473-54175786
chr1:56861276-56876438
chr1:57512145-57512200
Run Code Online (Sandbox Code Playgroud)
我试过paste -d ':-' file
,这显然不起作用。有人可以帮忙吗?
理想情况下可以使用简单的 unix 命令,我知道使用高级语言很容易。