如何将日期时间列舍入到最接近的四分之一小时

sfa*_*tor 33 python datetime python-datetime pandas

我已将数据文件加载到Python pandas数据帧中.我有一个格式的日期时间列2015-07-18 13:53:33.280.

我需要做的是创建一个新的列,将其四舍五入到最接近的四分之一小时.因此,上述日期将四舍五入为2015-07-18 13:45:00.000.

我怎么在熊猫里这样做?我尝试使用此处的解决方案,但收到'Series' object has no attribute 'year'错误.

two*_*rec 84

你可以用round(freq).column.dt日期时间函数访问还有一个快捷方式(如@ laurens-koppenol建议的那样).

这是单行:

df['old column'].dt.round('15min')  
Run Code Online (Sandbox Code Playgroud)

可以在此处找到有效频率的字符串别名.完整的工作示例:

In [1]: import pandas as pd    
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
                           pd.Timestamp('2015-07-18 13:33:33.330')],
                         columns=['old column'])

In [3]: df['new column']=df['old column'].dt.round('15min')  
In [4]: df
Out[4]: 
               old column          new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00
Run Code Online (Sandbox Code Playgroud)

  • 如果想要舍入到低于或高于最接近的时间,可以分别使用`floor`和`ceil`.见[code](https://github.com/pandas-dev/pandas/blob/v0.20.3/pandas/core/indexes/datetimelike.py#L112-L114) (5认同)

Ana*_*mar 34

假设你的系列由datetime对象组成,你需要使用Series.apply.示例 -

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))
Run Code Online (Sandbox Code Playgroud)

以上示例始终舍入到上一个四分之一小时(行为类似于楼层功能).

编辑

四舍五入到正确的四分之一小时(如果,如果是上一季度的7分30秒,则显示下一季度).我们可以使用下面的例子 -

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))
Run Code Online (Sandbox Code Playgroud)

以上只考虑最新的秒数,如果你想要毫秒/微秒,你可以将其添加到上面的等式中 - (float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)

  • 答案仍然不正确。当时间为 7:59 时,这将尝试执行“datetime(y,m,d,7,60)”,但会失败,因为 60 对于“分钟”来说是无效值。@tworec 有一个更好的答案,应该被接受。 (4认同)

Lau*_*nol 14

这看起来好一点

column.dt.允许datetime列的datetime函数,就像column.str.字符串式列一样

类似于datetime的属性API参考

import pandas as pd

# test df
df = pd.DataFrame([{'old_column':pd.Timestamp('2015-07-18 13:53:33.280')}])

df['new_column'] = df['old_column'].dt.round('15min')

df
Run Code Online (Sandbox Code Playgroud)


Eri*_*lum 6

Anand S Kumar的答案没有四舍五入到最接近的四分之一小时,它将分钟缩短到最接近的15分钟.

其实,在你的榜样2015-07-18 13:53:33.280应该四舍五入到2015-07-18 14:00:00.000,因为53:33.280就是超过45分钟接近60分钟.

我在这篇文章中找到了一个更有力的答案.

对于你的情况,这应该工作:

import datetime

def round_time(time, round_to):
    """roundTo is the number of minutes to round to"""
    rounded = time + datetime.timedelta(minutes=round_to/2.)
    rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
                                  seconds=rounded.second,
                                  microseconds=rounded.microsecond)
    return rounded

dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))
Run Code Online (Sandbox Code Playgroud)