Ale*_*nko 583 python datetime iso8601 rfc3339 datetime-parsing
我需要将RFC 3339字符串解析"2008-09-03T20:56:35.450686Z"为Python的datetime类型.
我strptime在Python标准库中找到了,但它不是很方便.
做这个的最好方式是什么?
Fli*_*imm 413
该蟒蛇-dateutil包可以解析不仅RFC 3339日期时间字符串像在的问题,还包括其他ISO 8601不符合RFC 3339(日期和时间字符串,如没有UTC那些偏移,或那些代表只有约会).
>>> import dateutil.parser
>>> dateutil.parser.parse('2008-09-03T20:56:35.450686Z') # RFC 3339 format
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686, tzinfo=tzutc())
>>> dateutil.parser.parse('2008-09-03T20:56:35.450686') # ISO 8601 extended format
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686)
>>> dateutil.parser.parse('20080903T205635.450686') # ISO 8601 basic format
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686)
>>> dateutil.parser.parse('20080903') # ISO 8601 basic format, date only
datetime.datetime(2008, 9, 3, 0, 0)
Run Code Online (Sandbox Code Playgroud)
请注意,这dateutil.parser是故意的hacky:它试图猜测格式并在不明确的情况下做出不可避免的假设(仅可手工定制).如果您需要解析未知格式的输入都还可以忍受偶尔的误读所以用它.(感谢ivan_pozdeev)
Pypi的名字python-dateutil不是dateutil(谢谢code3monk3y):
pip install python-dateutil
Run Code Online (Sandbox Code Playgroud)
如果你使用的是Python 3.7,看看这个答案约datetime.datetime.fromisoformat.
小智 158
注意在Python 2.6+和Py3K中,%f字符捕获微秒.
>>> datetime.datetime.strptime("2008-09-03T20:56:35.450686Z", "%Y-%m-%dT%H:%M:%S.%fZ")
Run Code Online (Sandbox Code Playgroud)
在这里看问题
Mar*_*ery 150
这里有几个答案 建议使用时区解析RFC 3339或ISO 8601日期时间,如问题中展示的那样: datetime.datetime.strptime
2008-09-03T20:56:35.450686Z
Run Code Online (Sandbox Code Playgroud)
这是一个坏主意.
假设您想要支持完整的RFC 3339格式,包括支持除零以外的UTC偏移,那么这些答案建议的代码不起作用.实际上,它无法工作,因为解析RFC 3339语法strptime是不可能的.Python的datetime模块使用的格式字符串无法描述RFC 3339语法.
问题是UTC偏移.在RFC 3339互联网日期/时间格式要求每个日期时间包括UTC偏移,并且这些偏移可以是Z(以下简称"祖鲁时间"),或在+HH:MM或-HH:MM格式,如+05:00或-10:30.
因此,这些都是有效的RFC 3339日期时间:
2008-09-03T20:56:35.450686Z2008-09-03T20:56:35.450686+05:002008-09-03T20:56:35.450686-10:30唉,格式字符串使用strptime并且strftime没有与RFC 3339格式的UTC偏移相对应的指令.可以在https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior找到它们支持的指令的完整列表,列表中包含的唯一UTC偏移指令是%z:
%Z
UTC偏移量,格式为+ HHMM或-HHMM(如果对象是天真的,则为空字符串).
示例:(空),+ 0000,-0400,+ 1030
这与RFC 3339偏移的格式不匹配,实际上如果我们尝试%z在格式字符串中使用并解析RFC 3339日期,我们将失败:
>>> from datetime import datetime
>>> datetime.strptime("2008-09-03T20:56:35.450686Z", "%Y-%m-%dT%H:%M:%S.%f%z")
Traceback (most recent call last):
File "", line 1, in
File "/usr/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
tt, fraction = _strptime(data_string, format)
File "/usr/lib/python3.4/_strptime.py", line 337, in _strptime
(data_string, format))
ValueError: time data '2008-09-03T20:56:35.450686Z' does not match format '%Y-%m-%dT%H:%M:%S.%f%z'
>>> datetime.strptime("2008-09-03T20:56:35.450686+05:00", "%Y-%m-%dT%H:%M:%S.%f%z")
Traceback (most recent call last):
File "", line 1, in
File "/usr/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
tt, fraction = _strptime(data_string, format)
File "/usr/lib/python3.4/_strptime.py", line 337, in _strptime
(data_string, format))
ValueError: time data '2008-09-03T20:56:35.450686+05:00' does not match format '%Y-%m-%dT%H:%M:%S.%f%z'Run Code Online (Sandbox Code Playgroud)
(实际上,上面就是你在Python 3中看到的内容.在Python 2中,我们会因为一个更简单的原因而失败,这在Python 2中strptime根本没有实现该%z指令.)
这里的多个答案建议strptime通过Z在其格式字符串中包含一个文字来推荐所有工作,该字符串与Z问题提供者的示例日期时间字符串匹配(并丢弃它,生成datetime没有时区的对象):
>>> datetime.strptime("2008-09-03T20:56:35.450686Z", "%Y-%m-%dT%H:%M:%S.%fZ")
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686)Run Code Online (Sandbox Code Playgroud)
由于这会丢弃原始日期时间字符串中包含的时区信息,因此我们是否应该将此结果视为正确是值得怀疑的.但更重要的是,因为这种方法涉及将特定的UTC偏移硬编码到格式字符串中,所以它会在尝试使用不同的UTC偏移量解析任何RFC 3339日期时间时阻塞:
>>> datetime.strptime("2008-09-03T20:56:35.450686+05:00", "%Y-%m-%dT%H:%M:%S.%fZ")
Traceback (most recent call last):
File "", line 1, in
File "/usr/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
tt, fraction = _strptime(data_string, format)
File "/usr/lib/python3.4/_strptime.py", line 337, in _strptime
(data_string, format))
ValueError: time data '2008-09-03T20:56:35.450686+05:00' does not match format '%Y-%m-%dT%H:%M:%S.%fZ'Run Code Online (Sandbox Code Playgroud)
除非您确定在Zulu时间内只需要支持RFC 3339日期时间,而不是其他时区偏移量,否则请不要使用strptime.请使用此处答案中描述的许多其他方法之一.
abc*_*ccd 135
该datetime标准库中引入了一个功能反转datetime.isoformat().
classmethoddatetime.fromisoformat(date_string):返回
datetime对应date_string于其中一种格式的date.isoformat()和datetime.isoformat().具体来说,此函数支持格式的字符串:
YYYY-MM-DD[*HH[:MM[:SS[.mmm[mmm]]]][+HH:MM[:SS[.ffffff]]]]哪里
*可以匹配任何单个字符.注意:这不支持解析任意ISO 8601字符串 - 它仅用作反向操作
datetime.isoformat().
使用示例:
from datetime import datetime
date = datetime.fromisoformat('2017-01-01T12:30:59.000000')
Run Code Online (Sandbox Code Playgroud)
Nic*_*ley 72
试试iso8601模块; 它正是这样做的.
python.org wiki 上的WorkingWithTime页面上提到了其他几个选项.
小智 34
import re,datetime
s="2008-09-03T20:56:35.450686Z"
d=datetime.datetime(*map(int, re.split('[^\d]', s)[:-1]))
tzo*_*zot 30
你得到的确切错误是什么?它像下面这样吗?
>>> datetime.datetime.strptime("2008-08-12T12:20:30.656234Z", "%Y-%m-%dT%H:%M:%S.Z")
ValueError: time data did not match format: data=2008-08-12T12:20:30.656234Z fmt=%Y-%m-%dT%H:%M:%S.Z
Run Code Online (Sandbox Code Playgroud)
如果是,您可以将输入字符串拆分为".",然后将微秒添加到您获得的日期时间.
试试这个:
>>> def gt(dt_str):
dt, _, us= dt_str.partition(".")
dt= datetime.datetime.strptime(dt, "%Y-%m-%dT%H:%M:%S")
us= int(us.rstrip("Z"), 10)
return dt + datetime.timedelta(microseconds=us)
>>> gt("2008-08-12T12:20:30.656234Z")
datetime.datetime(2008, 8, 12, 12, 20, 30, 656234)
Run Code Online (Sandbox Code Playgroud)
MrF*_*pes 24
来自其中一条评论的一个简单选项:替换'Z'为'+00:00'- 并使用 Python 3.7+ fromisoformat:
from datetime import datetime
s = "2008-09-03T20:56:35.450686Z"
datetime.fromisoformat(s.replace('Z', '+00:00'))
# datetime.datetime(2008, 9, 3, 20, 56, 35, 450686, tzinfo=datetime.timezone.utc)
Run Code Online (Sandbox Code Playgroud)
虽然strptime可以将'Z'字符解析为 UTC,但fromisoformat速度要快 ~ x40(另请参阅:更快的 strptime):
%timeit datetime.fromisoformat(s.replace('Z', '+00:00'))
346 ns ± 22.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
%timeit datetime.strptime(s, '%Y-%m-%dT%H:%M:%S.%f%z')
14.2 µs ± 452 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
%timeit dateutil.parser.parse(s)
80.1 µs ± 3.32 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
Run Code Online (Sandbox Code Playgroud)
(Windows 10 上的 Python 3.8.7 x64)
小智 19
在这些日子里,Arrow也可以用作第三方解决方案:
>>> import arrow
>>> date = arrow.get("2008-09-03T20:56:35.450686Z")
>>> date.datetime
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686, tzinfo=tzutc())
Run Code Online (Sandbox Code Playgroud)
And*_*ous 19
从Python 3.7开始,strptime支持UTC偏移(源)中的冒号分隔符.所以你可以使用:
import datetime
datetime.datetime.strptime('2018-01-31T09:24:31.488670+00:00', '%Y-%m-%dT%H:%M:%S.%f%z')
Run Code Online (Sandbox Code Playgroud)
Bla*_*g23 16
只需使用python-dateutil模块:
>>> import dateutil.parser as dp
>>> t = '1984-06-02T19:05:00.000Z'
>>> parsed_t = dp.parse(t)
>>> print(parsed_t)
datetime.datetime(1984, 6, 2, 19, 5, tzinfo=tzutc())
Run Code Online (Sandbox Code Playgroud)
enc*_*ter 13
如果您不想使用dateutil,可以尝试以下功能:
def from_utc(utcTime,fmt="%Y-%m-%dT%H:%M:%S.%fZ"):
"""
Convert UTC time string to time.struct_time
"""
# change datetime.datetime to time, return time.struct_time type
return datetime.datetime.strptime(utcTime, fmt)
Run Code Online (Sandbox Code Playgroud)
测试:
from_utc("2007-03-04T21:08:12.123Z")
Run Code Online (Sandbox Code Playgroud)
结果:
datetime.datetime(2007, 3, 4, 21, 8, 12, 123000)
Run Code Online (Sandbox Code Playgroud)
Don*_*kby 11
如果你正在使用Django,它提供了dateparse模块,它接受一系列类似于ISO格式的格式,包括时区.
如果您不使用Django而您不想使用此处提到的其他库,则可以将dateparse的Django源代码调整到您的项目中.
我发现ciso8601是解析ISO 8601时间戳的最快方法.顾名思义,它是用C实现的.
import ciso8601
ciso8601.parse_datetime('2014-01-09T21:48:00.921000+05:30')
Run Code Online (Sandbox Code Playgroud)
与其他答案中列出的所有其他库相比,GitHub Repo README显示其速度提高了10倍.
我的个人项目涉及很多ISO 8601解析.很高兴能够只是拨打电话并快10倍.:)
编辑:我已成为ciso8601的维护者.现在比以往任何时候都快!
我是iso8601 utils的作者.它可以在GitHub或PyPI 上找到.以下是解析示例的方法:
>>> from iso8601utils import parsers
>>> parsers.datetime('2008-09-03T20:56:35.450686Z')
datetime.datetime(2008, 9, 3, 20, 56, 35, 450686)
Run Code Online (Sandbox Code Playgroud)
另一种方法是使用 ISO-8601 的专用解析器,即使用dateutil 解析器的isoparse函数:
from dateutil import parser
date = parser.isoparse("2008-09-03T20:56:35.450686+01:00")
print(date)
Run Code Online (Sandbox Code Playgroud)
输出:
2008-09-03 20:56:35.450686+01:00
Run Code Online (Sandbox Code Playgroud)
标准 Python 函数datetime.fromisoformat的文档中也提到了此函数:
第三方包 dateutil 中提供了功能更全的 ISO 8601 解析器 dateutil.parser.isoparse。
我为ISO 8601标准编写了一个解析器并将其放在GitHub上:https://github.com/boxed/iso8601.此实现支持规范中的所有内容,但持续时间,间隔,周期间隔以及Python日期时间模块支持的日期范围之外的日期除外.
测试包括在内!:P
这适用于从Python 3.2开始的stdlib(假设所有时间戳均为UTC):
from datetime import datetime, timezone, timedelta
datetime.strptime(timestamp, "%Y-%m-%dT%H:%M:%S.%fZ").replace(
tzinfo=timezone(timedelta(0)))
Run Code Online (Sandbox Code Playgroud)
例如,
>>> datetime.utcnow().replace(tzinfo=timezone(timedelta(0)))
... datetime.datetime(2015, 3, 11, 6, 2, 47, 879129, tzinfo=datetime.timezone.utc)
Run Code Online (Sandbox Code Playgroud)
datetime.datetime在不安装第三方模块的情况下,将类似ISO 8601的日期字符串转换为所有支持的Python版本中的UNIX时间戳或对象的一种简单方法是使用SQLite的日期解析器.
#!/usr/bin/env python
from __future__ import with_statement, division, print_function
import sqlite3
import datetime
testtimes = [
"2016-08-25T16:01:26.123456Z",
"2016-08-25T16:01:29",
]
db = sqlite3.connect(":memory:")
c = db.cursor()
for timestring in testtimes:
c.execute("SELECT strftime('%s', ?)", (timestring,))
converted = c.fetchone()[0]
print("%s is %s after epoch" % (timestring, converted))
dt = datetime.datetime.fromtimestamp(int(converted))
print("datetime is %s" % dt)
Run Code Online (Sandbox Code Playgroud)
输出:
2016-08-25T16:01:26.123456Z is 1472140886 after epoch
datetime is 2016-08-25 12:01:26
2016-08-25T16:01:29 is 1472140889 after epoch
datetime is 2016-08-25 12:01:29
Run Code Online (Sandbox Code Playgroud)
小智 6
Django的parse_datetime()函数支持UTC偏移的日期:
parse_datetime('2016-08-09T15:12:03.65478Z') =
datetime.datetime(2016, 8, 9, 15, 12, 3, 654780, tzinfo=<UTC>)
Run Code Online (Sandbox Code Playgroud)
因此,它可用于在整个项目中的字段中解析ISO 8601日期:
from django.utils import formats
from django.forms.fields import DateTimeField
from django.utils.dateparse import parse_datetime
class DateTimeFieldFixed(DateTimeField):
def strptime(self, value, format):
if format == 'iso-8601':
return parse_datetime(value)
return super().strptime(value, format)
DateTimeField.strptime = DateTimeFieldFixed.strptime
formats.ISO_INPUT_FORMATS['DATETIME_INPUT_FORMATS'].insert(0, 'iso-8601')
Run Code Online (Sandbox Code Playgroud)
如果pandas无论如何使用,我可以Timestamp推荐pandas。在那里你可以
ts_1 = pd.Timestamp('2020-02-18T04:27:58.000Z')
ts_2 = pd.Timestamp('2020-02-18T04:27:58.000')
Run Code Online (Sandbox Code Playgroud)
Rant:令人难以置信的是,我们在 2021 年仍然需要担心日期字符串解析之类的问题。
| 归档时间: |
|
| 查看次数: |
355521 次 |
| 最近记录: |