小编wal*_*box的帖子

在熊猫数据框中组合具有重叠时间段的行

我正在研究处方习惯并拥有大量已售产品的数据框。

我试图通过计算产品将持续多长时间并添加 5 天的依从性、开始延迟等因素来计算购买的结束日期,从而将药物的购买转化为药物的疗程。

然后我想将处方与重叠的日期窗口结合起来,但我正在努力寻找一种有效的方法来做到这一点。我希望 groupby 是可能的,但我不知道如何做到这一点。

我知道如何迭代数据帧以创建一个包含相关信息的新数据帧,但这是一个缓慢的操作,我希望我能找到一个更优雅的解决方案。

ID      start       end         ingredient  days    dose    end
1000    2018-10-03  2018-10-18  Metron...   10.0    125.00 
1000    2018-10-13  2018-10-25  Metron...   7.0     125.00 
1001    2018-03-08  2018-03-20  Cefalexin   7.0     150.00
1001    2018-09-17  2018-10-05  Cefalexin   13.0    150.00
1002    2018-05-18  2018-05-30  Amoxiclav   7.0     75.00
1002    2018-05-25  2018-06-06  Amoxiclav   7.0     100.00 
1003    2018-07-01  2018-07-16  Amoxiclav   10.0    50.00
1003    2018-07-15  2018-07-30  Amoxiclav   10.0    50.00 
1003    2018-07-25  2018-08-09  Amoxiclav   10.0    50.00 
Run Code Online (Sandbox Code Playgroud)

我的预期结果如下:

ID      start       end         ingredient  days    dose
1000    2018-10-03  2018-10-25  Metron... …
Run Code Online (Sandbox Code Playgroud)

dataframe python-3.x pandas

8
推荐指数
1
解决办法
3696
查看次数

标签 统计

dataframe ×1

pandas ×1

python-3.x ×1