带有冒号的时区偏移的日期时间 strptime 问题

Bru*_*uno 7 python python-datetime python-3.6 python-3.7

目前,我们正在开发一个应用程序,该应用程序尝试使用 2.db.transport.rest API 计算从 a 到 b 的路线的旅行时间。

不幸的是,我们正在从该 API 接收带有时区偏移量的时间戳,例如+01:00. 我们需要的是一个没有:, 所以的时区偏移量+0100

以下示例在 Linux 上使用 Python 3.6.7 给出错误:

from datetime import datetime
datetimestring = "2019-01-19T15:13:00.000+01:00"
datetime.strptime(datetimestring, '%Y-%m-%dT%H:%M:%S.%f%z')
Run Code Online (Sandbox Code Playgroud)

此示例代码产生此异常:

ValueError: time data '2019-01-19T15:13:00.000+01:00' does not match format '%Y-%m-%dT%H:%M:%S.%f%z'
Run Code Online (Sandbox Code Playgroud)

如果我们:从它工作的输入字符串中删除,则不会抛出异常。

当我们在 Python 3.7.2 上的 Windows 上运行该代码时,该代码也有效。

可能是因为不同的 Python 版本?我们如何解析或转换它而不会出错?

Mar*_*ers 5

是的,这是版本问题。您正在依赖Python 3.7 中引入的新功能

来自datetime.strptime()文档,第 6 个脚注:

版本 3.7 中的更改:当%z向方法提供指令时strptime(),UTC 偏移量可以使用冒号作为小时、分钟和秒之间的分隔符。例如,'+01:00:00'将被解析为一小时的偏移量。

如果您无法在所有地方升级到 Python 3.7,那么您可以通过一些预处理删除这些冒号:

import re

datetimestring = re.sub(r'([-+]\d{2}):(\d{2})(?:(\d{2}))?$', r'\1\2\3', datetimestring)
Run Code Online (Sandbox Code Playgroud)

HH:MM正则表达式从任何or偏移量中删除冒号HH:MM:SS(出现在字符串末尾且前面带有-or +):

演示:

>>> import re
>>> from datetime import datetime
>>> datetimestring = "2019-01-19T15:13:00.000+01:00"
>>> corrected = re.sub(r'([-+]\d{2}):(\d{2})(?:(\d{2}))?$', r'\1\2\3', datetimestring)
>>> corrected
'2019-01-19T15:13:00.000+0100'
>>> datetime.strptime(corrected, '%Y-%m-%dT%H:%M:%S.%f%z')
datetime.datetime(2019, 1, 19, 15, 13, tzinfo=datetime.timezone(datetime.timedelta(seconds=3600)))
Run Code Online (Sandbox Code Playgroud)

如果你要在任何地方升级到Python 3.7,你可以strptime()完全放弃解析并简单地使用专用datetime.fromisoformat()方法;它可以直接解析您的输入。

>>> datetime.fromisoformat(datetimestring)
datetime.datetime(2019, 1, 19, 15, 13, tzinfo=datetime.timezone(datetime.timedelta(seconds=3600)))
Run Code Online (Sandbox Code Playgroud)