在 Pandas 中将字符串转换为 timedelta

Gil*_*s L 7 python string series timedelta pandas

我有一个系列,其中时间戳的格式为HHHHH:MM

timestamp = pd.Series(['34:23', '125:26', '15234:52'], index=index)
Run Code Online (Sandbox Code Playgroud)

我想将其转换为 timedelta 系列。

现在我设法在一个字符串上做到这一点:

str[:-3]
str[-2:]
timedelta(hours=int(str[:-3]),minutes=int(str[-2:]))
Run Code Online (Sandbox Code Playgroud)

如果可能的话,我想以更简洁的方式将它应用到整个系列中。有没有办法做到这一点?

jpp*_*jpp 11

您可以使用按列的 Pandas 方法:

s = pd.Series(['34:23','125:26','15234:52'])

v = s.str.split(':', expand=True).astype(int)
s = pd.to_timedelta(v[0], unit='h') + pd.to_timedelta(v[1], unit='m')

print(s)

0     1 days 10:23:00
1     5 days 05:26:00
2   634 days 18:52:00
dtype: timedelta64[ns]
Run Code Online (Sandbox Code Playgroud)

正如评论中所指出的,这也可以在一行中实现,尽管不太清楚:

s = pd.to_timedelta((s.str.split(':', expand=True).astype(int) * (60, 1)).sum(axis=1), unit='min')
Run Code Online (Sandbox Code Playgroud)


ern*_*cyp 1

我就是这样做的:

timestamp = pd.Series(['34:23','125:26','15234:52'])
x = timestamp.str.split(":").apply(lambda x: int(x[0])*60 + int(x[1]))
timestamp = pd.to_timedelta(x, unit='s')
Run Code Online (Sandbox Code Playgroud)