我有 2 个文件,文件 1 的第 1 列必须替换为文件 2 的第 2 列,在文件 1 的第 2、3、4-5 或 5-4(交叉匹配)列与第 1、4、5 列匹配之后文件 2 的 -6 或 6-5。
文件 1
SNP Chr Pos EA NEA EAF Beta SE Pvalue Neff
1:79137 1 79137 A T 0.25 -0.026 0.0073 4.0e-04 231420
1:79033 1 79033 A G 0.0047 -0.038 0.056 4.9e-01 225429
1:118630 1 118630 C T 0.99 -0.033 0.055 5.5e-01 226311
1:533179 1 533179 A G 1 -0.098 0.19 6.1e-01 185906
Run Code Online (Sandbox Code Playgroud)
档案 2
1 1:79033_A_G 0 …
Run Code Online (Sandbox Code Playgroud) 我有一个包含多行的文件,如下所示。我只想提取第 2、3、5、6 列;但是第三列没有“chr”前缀:
输入:
585 ENST00000417324 chr1 - 34553 36081 36081 36081 3
Run Code Online (Sandbox Code Playgroud)
输出:
ENST00000417324 1 34553 36081
Run Code Online (Sandbox Code Playgroud)
我会使用 awk,因为任务非常简单,但我不知道如何去掉 'chr' 前缀。
谢谢!