小编Jos*_*osh的帖子

使用pandas对数据帧进行时间分级

我试图使用熊猫数据帧分析几周内测量"X"的平均每日波动,但是时间戳/日期时间等特别难以处理.花了好几个小时试图解决这个问题我的代码变得越来越混乱,我认为我没有更接近解决方案,希望有人能指导我朝着正确的方向前进.

我在不同时间和不同日期测量了X,将每日结果保存到具有以下形式的数据框:

    Timestamp(datetime64)         X 

0    2015-10-05 00:01:38          1
1    2015-10-05 06:03:39          4 
2    2015-10-05 13:42:39          3
3    2015-10-05 22:15:39          2
Run Code Online (Sandbox Code Playgroud)

随着测量时间每天都在变化,我决定使用分箱来组织数据,然后计算每个箱子的平均值和STD,然后我可以绘制.我的想法是创建一个带有分档的最终数据框和测量的X的平均值,"观察"栏目只是为了帮助理解:

        Time Bin       Observations     <X>  

0     00:00-05:59      [ 1 , ...]       2.3
1     06:00-11:59      [ 4 , ...]       4.6
2     12:00-17:59      [ 3 , ...]       8.5
3     18:00-23:59      [ 2 , ...]       3.1
Run Code Online (Sandbox Code Playgroud)

然而,我遇到了使用pd.cut和pd.groupby时间,日期时间,日期时间64,时间和分组之间不兼容的困难,基本上我觉得我在黑暗中做刺,不知道'正确'解决这个问题的方法.我能想到的唯一解决方案是通过数据帧逐行迭代,但我真的想避免这样做.

python pandas

6
推荐指数
2
解决办法
7388
查看次数

标签 统计

pandas ×1

python ×1