小编Sam*_*ami的帖子

使用多个键连接两个文本文件

我有两组数据。我想通过两个键值(storm_ID、Cell_ID)加入它们。

第一个数据集看起来像:

Storm_ID,Cell_ID,Wind_speed 
2,10236258,27 
2,10236300,58 
2,10236301,25 
3,10240400,51
Run Code Online (Sandbox Code Playgroud)

第二个数据集看起来像:

Storm_ID,Cell_ID,Storm_surge 
2,10236299,0.27 
2,10236300,0.27 
2,10236301,0.35 
2,10240400,0.35 
2,10240401,0.81 
4,10240402,0.11
Run Code Online (Sandbox Code Playgroud)

现在我想要一个看起来像这样的输出:

Storm_ID,Cell_ID,Wind_speed,Storm_surge 
2,10236258,27,0 
2,10236299,0,0.27 
2,10236300,58,0.27 
2,10236301,25,0.35 
2,10240400,0,0.35 
2,10240401,0,0.81 
3,10240400,51,0 
4,10240402,0,0.11
Run Code Online (Sandbox Code Playgroud)

我尝试在 Linux 中使用 join 命令来执行此任务,但失败了。Join 命令跳过了数据库中不匹配的行。我可以使用 Matlab,但数据大小超过 100 GB,这使得这项任务非常困难。有人可以请指导我吗?我可以使用 SQL 或 python 来完成这个任务。

command-line awk text-processing

2
推荐指数
1
解决办法
252
查看次数

标签 统计

awk ×1

command-line ×1

text-processing ×1