小编dav*_*avy的帖子

熊猫数据框在重叠的时间范围内联接

我有两个数据框。每一个都有一个代表开始时间的时间戳索引和一个可以用于计算结束时间的持续时间值(以秒为单位)。每个数据帧的时间间隔和持续时间都不同,并且在每个数据帧内也可能有所不同。

                     duration   param1
Start Time (UTC) 
2017-10-14 02:00:31   60         95
2017-10-14 02:01:31   60         34
2017-10-14 02:02:31   60         10
2017-10-14 02:03:31   60         44
2017-10-14 02:04:31   60         63
2017-10-14 02:05:31   60         52
...

                     duration   param2
Start Time (UTC)
2017-10-14 02:00:00   300        93
2017-10-14 02:05:00   300        95
2017-10-14 02:10:00   300        91
...
Run Code Online (Sandbox Code Playgroud)

我想加入这两个数据帧,以保持第一个的索引和列,但是使用以下方案将第二个的参数值复制到它:

对于第一数据帧中的每一行,从(排序的)第二数据帧中的第一行分配param2值,该值包含50%或更多的时间范围。

下面的示例输出:

                     duration   param1   param2
Start Time (UTC) 
2017-10-14 02:00:31   60         95        93
2017-10-14 02:01:31   60         34        93
2017-10-14 02:02:31   60         10        93
2017-10-14 02:03:31   60         44        93
2017-10-14 02:04:31 …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

5
推荐指数
1
解决办法
94
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1