将轮班数据（开始和结束时间）分解为每小时数据

Question

将轮班数据（开始和结束时间）分解为每小时数据

我有一个df，如下所示，它显示一个人何时开始轮班，结束轮班，工作时间和工作日期。

Business_Date   Number PayTimeStart PayTimeEnd          Hours
0   2019-05-24  1       2019-05-24 11:00:00 2019-05-24 12:15:00 1.250
1   2019-05-24  2       2019-05-24 12:30:00 2019-05-24 13:30:00 1.00

Run Code Online (Sandbox Code Playgroud)

现在我想做的是将其分成小时格式，所以我知道11:00-12:00之间使用了多少小时

因此，在我的脑海中，对于上述情况，我想将11-12之间的1小时放入11:00的垃圾箱中，将剩余的0.25放入下一个12垃圾箱

所以我最终会得到类似

    Business Date   Time Hour
0   2019-05-24  11:00 1
1   2019-05-24  12:00 0.75
2   2019-05-24  13:00 0.5

Run Code Online (Sandbox Code Playgroud)

Answer 1

jez*_*ael 5

一个想法是使用分钟-首先使用列表理解并进行展平Series，然后hours使用hours进行分组GroupBy.size，最后进行除以60最后一个小时：

s = pd.Series([z for x, y in zip(df['Pay Time Start'], 
                                 df['Pay Time End'] - pd.Timedelta(60, unit='s')) 
                 for z in pd.date_range(x, y, freq='Min')])

df = (s.groupby([s.dt.date.rename('Business Date'), s.dt.hour.rename('Time')])
       .size()
       .div(60)
       .reset_index(name='Hour'))
print (df)
  Business Date  Time  Hour
0    2019-05-24    11  1.00
1    2019-05-24    12  0.75
2    2019-05-24    13  0.50

Run Code Online (Sandbox Code Playgroud)

如果您需要按位置或ID分组

 df1 = pd.DataFrame([(z, w) for x, y, w in zip(df['Pay Time Start'], 
                                              df['Pay Time End'] - pd.Timedelta(60, unit='s'), 
                                              df['Location']) for z in pd.date_range(x, y, freq='Min')], 
                   columns=['Date','Location']) 

 df = (df1.groupby([df1['Date'].dt.date.rename('Business Date'), 
                       df1['Date'].dt.hour.rename('Time'), df1['Location']]) 
          .size() .div(60) .reset_index(name='Hour'))

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，5 月前
查看次数：	108 次
最近记录：	6 年，4 月前