Lua ISO 8601日期时间解析模式

Bri*_*pin 9 lua datetime parsing date

我正在尝试从Lua中的JSON数据解析完整的ISO8601日期时间.我遇到了匹配模式的问题.

到目前为止,这就是我所拥有的:

-- Example datetime string 2011-10-25T00:29:55.503-04:00
local datetime = "2011-10-25T00:29:55.503-04:00"
local pattern = "(%d+)%-(%d+)%-(%d+)T(%d+):(%d+):(%d+)%.(%d+)"
local xyear, xmonth, xday, xhour, xminute, 
        xseconds, xmillies, xoffset = datetime:match(pattern)

local convertedTimestamp = os.time({year = xyear, month = xmonth, 
        day = xday, hour = xhour, min = xminute, sec = xseconds})
Run Code Online (Sandbox Code Playgroud)

我坚持如何处理模式上的时区,因为没有逻辑或将处理 - 或+或没有.虽然我知道lua不支持os.time函数中的时区,但至少我知道它需要如何调整.

我考虑在"."之后剥掉一切.(毫秒和时区),但那时我真的没有有效的日期时间.毫秒不是那么重要,我不介意失去它,但时区改变了事情.

注意:有人可能有一些更好的代码来做这个,我没有嫁给它,我只需要从日期时间字符串中获得一些有用的东西:)

kik*_*ito 11

单个模式匹配无法完成完整的ISO 8601格式.变化太多了.

维基百科页面中的一些示例:

  • 有一种"压缩"格式不能分开数字:YYYYMMDDvsYYYY-MM-DD
  • 这一天可以省略:YYYY-MM-DD并且YYYY-MM都是有效日期
  • 序数日期也有效:YYYY-DDD,DDD一年中的哪一天(1-365/6)
  • 表示时间时,可以省略分钟和秒:hh:mm:ss,hh:mm并且hh都是有效时间
  • 此外,时间也有一个压缩版本:hhmmss,hhmm
  • 最重要的是,时间接受分数,使用点或逗号来表示时间部分中较低时间元素的分数.14:30,5,1430,5,14:30.5,或1430.5都代表14个小时,30秒,半.
  • 最后,时区部分是可选的.如果存在,它可以是字母Z ±hh:mm,, ±hh±hhmm.

因此,如果您要根据完整规范进行解析,则需要考虑很多可能的例外情况.在这种情况下,您的初始代码可能如下所示:

function parseDateTime(str)
  local Y,M,D = parseDate(str)
  local h,m,s = parseTime(str)
  local oh,om = parseOffset(str)
  return os.time({year=Y, month=M, day=D, hour=(h+oh), min=(m+om), sec=s})
end
Run Code Online (Sandbox Code Playgroud)

然后你必须创建parseDate,parseTimeparseOffset.后者应返回UTC的时间偏移量,而前两个则必须考虑压缩格式,时间分数,逗号或点分隔符等内容.

parseDate可能会"^"在模式匹配开头使用该字符,因为日期必须位于字符串的开头.parseTime的模式可能会从一开始"T".并且parseOffset结束时"$",因为时间偏移,当它们存在时,它们就结束了.

"完整ISO" parseOffset功能可能与此类似:

function parseOffset(str)
  if str:sub(-1)=="Z" then return 0,0 end -- ends with Z, Zulu time

  -- matches ±hh:mm, ±hhmm or ±hh; else returns nils 
  local sign, oh, om = str:match("([-+])(%d%d):?(%d?%d?)$") 
  sign, oh, om = sign or "+", oh or "00", om or "00"

  return tonumber(sign .. oh), tonumber(sign .. om)
end
Run Code Online (Sandbox Code Playgroud)

顺便说一句,我假设您的计算机在UTC时间工作.如果不是这种情况,您必须在您的小时/分钟上加上额外的抵消额来计算.

function parseDateTime(str)
  local Y,M,D =   parseDate(str)
  local h,m,s =   parseTime(str)
  local oh,om =   parseOffset(str)
  local loh,lom = getLocalUTCOffset()
  return os.time({year=Y, month=M, day=D, hour=(h+oh-loh), min=(m+om-lom), sec=s})
end
Run Code Online (Sandbox Code Playgroud)

要获得本地偏移量,您可能需要查看http://lua-users.org/wiki/TimeZone.

我希望这有帮助.问候!