我有两个文件,文件1看起来像:
rs12126768 T 0.0252778071842686
rs908742 A -0.0175531592475892
rs3107147 A 0.0253753063312283
rs3128309 A 0.0284902703996274
rs16824948 T 0.0696193418800571
rs2643888 A 0.0452601314048646
rs3795272 T -0.0244976316004002
rs2840531 T -0.0438473997802763
rs10910060 A 0.0364283566135514
rs1129332 T -0.0274739770007551
Run Code Online (Sandbox Code Playgroud)
文件2看起来像:
1 rs908742 0 2033256
1 rs3795272 0 2284195
1 rs2840531 0 2286408
1 rs1129332 0 2336210
1 rs7512269 0 2418625
1 rs2247308 0 2445406
1 rs1980789 0 2455863
1 rs3122922 0 2456203
1 rs4648453 0 3025712
1 rs6424069 0 3147030
Run Code Online (Sandbox Code Playgroud)
如果文件1中的$ 1出现在文件2的$ 2中,我希望它打印该行.所以期望的输出将是:
rs908742 A -0.0175531592475892
rs3795272 T …
Run Code Online (Sandbox Code Playgroud) 我正在从线性模型中下沉输出,并试图通过将我感兴趣的参数四舍五入到2位小数来整理它.这适用于大多数参数,如beta或Z-score,但我对P值有困难.虽然我想要舍入到2位小数,但我的意思是2位小数,同时保留科学记数法.
例如:
P = 2.60699382414341e-56
round(P,2)
#[1] 0
Run Code Online (Sandbox Code Playgroud)
当我真正想要打印的是:
#2.61e-56
Run Code Online (Sandbox Code Playgroud)
有办法做到这一点吗?
我有两个文件,我想删除文件1中的行,其中文件1的第3列不等于文件2的第2列.
文件1看起来像
1111 1111 exm-IND1-200449980 I I
1111 1111 exm-IND1-201453487 I I
1111 1111 rs4477212 A A
1111 1111 rs3094315 A A
1111 1111 exm-IND11-102094357 D D
Run Code Online (Sandbox Code Playgroud)
文件2看起来像
1 rs4477212 0 82154
1 rs3094315 0 752566
1 rs3131972 0 752721
1 exm2268640 0 762320
1 rs12562034 0 768448
Run Code Online (Sandbox Code Playgroud)
期望的文件输出将是
1111 1111 rs4477212 A A
1111 1111 rs3094315 A A
Run Code Online (Sandbox Code Playgroud)
文件1是2.4GB,文件2是21.8MB.
提前感谢您的帮助.