Mid*_*ter 6 python numpy timedelta pandas
与此问题类似,我numpy.timedelta64在 Pandas DataFrame 中有一个列。按本回答上述问题,有一种功能pandas.tslib.repr_timedelta64,其很好地显示在天,小时timedelta:分钟:秒。我只想在几天和几小时内格式化它们。
所以我得到的是以下内容:
def silly_format(hours):
(days, hours) = divmod(hours, 24)
if days > 0 and hours > 0:
str_time = "{0:.0f} d, {1:.0f} h".format(days, hours)
elif days > 0:
str_time = "{0:.0f} d".format(days)
else:
str_time = "{0:.0f} h".format(hours)
return str_time
df["time"].astype("timedelta64[h]").map(silly_format)
Run Code Online (Sandbox Code Playgroud)
这让我想要的输出,但我不知道是否有一个函数numpy或pandas类似datetime.strftime,它可以格式化numpy.timedelta64根据提供的一些格式字符串?
我试图进一步调整@Jeff 的解决方案,但它比我的答案慢得多。这里是:
days = time_delta.astype("timedelta64[D]").astype(int)
hours = time_delta.astype("timedelta64[h]").astype(int) % 24
result = days.astype(str)
mask = (days > 0) & (hours > 0)
result[mask] = days.astype(str) + ' d, ' + hours.astype(str) + ' h'
result[(hours > 0) & ~mask] = hours.astype(str) + ' h'
result[(days > 0) & ~mask] = days.astype(str) + ' d'
Run Code Online (Sandbox Code Playgroud)
虽然 @sebix 和 @Jeff 提供的答案显示了将时间增量转换为天和小时的好方法,并且 @Jeff 的解决方案特别保留了 ' 索引Series,但它们缺乏字符串最终格式的灵活性。我现在使用的解决方案是:
def delta_format(days, hours):
if days > 0 and hours > 0:
return "{0:.0f} d, {1:.0f} h".format(days, hours)
elif days > 0:
return "{0:.0f} d".format(days)
else:
return "{0:.0f} h".format(hours)
days = time_delta.astype("timedelta64[D]")
hours = time_delta.astype("timedelta64[h]") % 24
return [delta_format(d, h) for (d, h) in izip(days, hours)]
Run Code Online (Sandbox Code Playgroud)
这很适合我,我通过将该列表插入到原始中来取回索引DataFrame。